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Preiacio 


Cada  vez  que  toma  un  periodico  o  una  revista,  cuando  ve  un  programa  por  television  o 
navega  en  Internet,  aparece  la  estadfstica.  Cada  vez  que  llena  un  cuestionario,  se  regis- 
tra  en  un  sitio  Web  o  desliza  su  tarjeta  de  puntos  en  algun  supermercado  por  el  lector 
electronico,  sus  datos  personales  pasan  a  una  base  de  datos  que  contiene  su  informacion 
estadfstica  personal.  No  puede  evitar  el  hecho  de  que  en  esta  era  de  la  informacion,  la 
recoleccion  y  analisis  de  datos  son  una  parte  integral  de  nuestras  actividades  cotidianas. 
A  fin  de  ser  un  cliente  y  un  ciudadano  educado,  necesita  entender  como  se  emplea  dfa 
con  dfa  y,  si  es  el  caso,  se  da  un  mal  uso  a  la  estadfstica  en  nuestras  vidas.  Para  ese  fin  es 
necesario  “entrenar  su  cerebro”  en  el  pensamiento  estadfstico,  un  tema  que  se  subraya  en 
la  decima  tercera  edicion,  al  proporcionarle  un  “entrenador  personal”. 


EL  SECRETO  DE  NUESTRO  EXITO 


En  el  primer  curso  universitario  de  estadfstica  introductoria  que  alguna  vez  tomamos  se 
empleo  el  libro  Introduction  a  la  probabilidad  y  la  estadfstica  de  William  Mendenhall. 
Desde  esa  ocasion,  este  texto,  en  la  actualidad  en  la  decima  tercera  edicion,  ha  ayudado 
a  varias  generaciones  de  alumnos  a  entender  lo  que  es  la  estadfstica  y  como  sirve  de 
herramienta  en  sus  areas  particulares  de  aplicacion.  El  secreto  del  exito  de  Introduction  a 
la  probabilidad  y  la  estadfstica  es  su  capacidad  para  combinar  lo  viejo  con  lo  nuevo. 
En  cada  revision  se  tratan  los  puntos  fuertes  de  ediciones  previas,  y  siempre  buscamos 
formas  nuevas  para  motivar,  alentar  e  interesar  a  los  alumnos  en  el  uso  de  nuevas  herra- 
mientas  tecnologicas. 


CARACTERISTICAS  DISTINTIVAS 
DE  LA  DECIMA  TERCERA  EDICION 


La  decima  tercera  edicion  mantiene  la  descripcion  tradicional  para  la  cobertura  de  los 
temas  de  la  estadfstica  descriptiva  e  inferencial.  Esta  revision  conserva  la  presentacion 
directa  de  la  decima  segunda  edicion.  En  este  sentido,  se  ha  continuado  con  la  simplifi- 
cacion  y  claridad  del  lenguaje  con  un  estilo  mas  legible  y  “amigable”,  sin  sacrificar  la 
integridad  estadfstica  de  la  presentacion.  Se  ha  hecho  un  gran  esfuerzo  por  “entrenar  su 
cerebro”  y  no  solo  como  aplicar  procedimientos  estadfsticos,  sino  tambien  para  explicar: 

•  como  describir  de  modo  significativo  conjuntos  reales  de  datos; 

•  que  significan  los  resultados  de  las  pruebas  estadfsticas  en  terminos  de  sus  aplica- 
ciones  practicas; 

•  como  evaluar  la  validez  de  los  supuestos  detras  de  las  pruebas  estadfsticas;  y 

•  que  hacer  cuando  se  han  violado  los  supuestos  estadfsticos. 
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Ejercicios 

Continuando  con  la  tradition  de  las  ediciones  previas,  la  variedad  y  el  niimero  de  apli- 
caciones  reales  en  los  conjuntos  de  ejercicios  es  la  mayor  fortaleza  de  esta  edicion.  Se 
han  revisado  los  conjuntos  de  ejercicios  para  darle  nuevas  e  interesantes  situaciones  del 
mundo  real  y  conjuntos  de  datos  reales,  muchos  de  ellos  extraidos  de  periodicos  y  revis¬ 
tas  cientificas  recientes.  La  decima  tercera  edicion  contiene  mas  de  1  300  problemas, 
muchos  de  los  cuales  son  nuevos  para  esta  edicion.  Todos  los  ejercicios  de  las  edicio¬ 
nes  anteriores  que  fueron  eliminados  en  esta,  se  encuentran  disponibles  para  el  profesor 
como  Classic  Exercices  en  el  Instructor's  Companion  Website  (academic.cengage.com/ 
statistics/mendenhall).  Los  ejercicios  se  graduan  segiin  su  nivel  de  dificultad;  algunos, 
relacionados  con  tecnicas  basicas,  se  pueden  resolver  por  casi  todos  los  alumnos,  mien- 
tras  que  otros,  moldeados  para  aplicaciones  practicas  e  interpretacion  de  resultados,  haran 
que  los  alumnos  usen  un  razonamiento  y  entendimiento  estadisticos  mas  complejos. 

Organizacion  y  cobertura 

En  los  capitulos  1-3,  se  presenta  el  analisis  descriptivo  de  datos  para  una  y  dos  varia¬ 
bles,  con  las  graficas  actualizadas  de  MINITAB.  Creemos  que  los  capitulos  del  1  al  10,  con 
exception  del  3,  deben  ser  cubiertos  en  el  orden  presentado.  Los  demas  capitulos  pueden 
ser  cubiertos  en  cualquier  orden.  El  capitulo  de  analisis  de  varianza  precede  al  capitulo  de 
regresion,  de  modo  que  el  profesor  presente  el  analisis  de  varianza  como  parte  de  un  anali¬ 
sis  de  regresion.  Asi,  la  presentacion  mas  efectiva  ordenarfa  tambien  estos  tres  capitulos. 

El  capitulo  4  incluye  una  presentacion  completa  de  probabilidad  y  distribuciones 
de  probabilidad.  Tres  secciones  opcionales:  reglas  de  conteo,  la  ley  de  probabilidad 
total  y  la  regia  de  Bayes,  se  colocaron  en  el  flujo  general  de  texto,  y  el  profesor  tendra 
la  option  de  hacer  una  cobertura  completa  o  parcial.  Las  secciones  que  presentan  las 
relaciones  de  eventos,  independencia,  probabilidad  condicional  y  la  regia  de  multipli¬ 
cation,  han  sido  reescritas  en  un  intento  por  aclarar  conceptos  que  por  lo  comun  son 
dificiles  de  comprender  por  los  alumnos.  Como  en  la  decima  segunda  edicion,  los 
capitulos  sobre  analisis  de  varianza  y  regresion  lineal  incluyen  formulas  de  calculo  e 
impresiones  de  computadora  en  la  presentacion  de  texto.  Los  profesores  que  deseen 
usar  el  metodo  de  calculo  “practico”  para  la  regresion  lineal  y  el  ANOVA,  y  quie- 
nes  elijan  enfocarse  en  la  interpretacion  de  las  impresiones  estadisticas  generadas  por 
computadora  pueden  usar  estos  capitulos  con  igual  facilidad. 

Un  cambio  importante  puesto  en  practica  en  esta  y  las  dos  ultimas  ediciones  es  el  en- 
fasis  en  los  valores  p  y  su  uso  para  juzgar  la  significancia  estadistica.  Con  el  advenimiento 
de  los  valores  p  generados  por  computadora,  estas  probabilidades  se  han  vuelto  com- 
ponentes  esenciales  al  informal'  los  resultados  del  analisis  estadistico.  Como  tal,  el  valor 
observado  del  estadistico  de  prueba  y  su  valor  p  se  presentan  juntos  al  inicio  de  la  ex¬ 
plication  de  la  prueba  de  hipotesis  estadistica  como  herramientas  equivalentes  para  la 
toma  de  decisiones.  La  significancia  estadistica  se  define  en  terminos  de  valores  pre- 
asignados  de  a,  y  el  metodo  del  valor  p  se  presenta  como  una  alternativa  al  metodo  del 
valor  critico  para  probar  una  hipotesis  estadistica.  Se  presentan  ejemplos  con  los  metodos 
del  valor  p  y  el  valor  critico  para  prueba  de  hipotesis.  La  explication  de  la  interpreta¬ 
tion  practica  de  los  resultados  estadisticos,  junto  con  las  diferencias  entre  significancia 
estadistica  y  practica,  se  subraya  en  los  ejemplos  practicos  del  texto. 

Nuevo  para  la  decima  tercera  edicion: 

Mi  entrenador  personal 

La  novedad  en  esta  edicion  son  las  secciones  Mi  entrenador  personal  que  cuentan  con 
definiciones  y/o  sugerencias  paso  a  paso  acerca  de  la  solution  del  problema.  Estas  secciones 
van  seguidas  de  Repertorio  de  ejercicios,  un  conjunto  de  ejercicios  relacionados  con  pro- 
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blemas  repetitivos  respecto  a  un  tema  o  concepto  especifico.  Este  repertorio  de  ejercicios 
se  compara  con  los  conjuntos  de  ejercicios  especificos  de  un  entrenador  para  un  atleta  en 
preparation.  Mientras  mas  repeticiones  realice  el  atleta,  adquiere  mas  fuerza  o  agilidad 
en  los  conjuntos  de  musculos  o  un  incremento  en  su  resistencia  en  condiciones  de  estres. 


ENTRENADOR  PERSONAL 

\  ^Como  calculo  cuartiles  muestrales? 

|  1 .  Acomode  el  conjunto  de  datos  en  orden  de  magnitud  de  menor  a  mayor. 

2.  Calcule  las  posiciones  de  cuartil: 

•  Posicion  de  Qx:  .25(n  +  1) 

•  Posicion  de  Q3\  .75(n  +1) 

3.  Si  las  posiciones  son  de  enteros,  entonces  Qx  y  Q3  son  los  valores  del  conjunto 
ordenado  de  datos  que  se  encuentra  en  esas  posiciones. 

4.  Si  las  posiciones  del  paso  2  no  son  de  enteros,  encuentre  las  dos  mediciones  en 
las  posiciones  un  poco  arriba  y  un  poco  debajo  de  la  posicion  calculada.  Calcu¬ 
le  el  cuartil  al  hallar  un  valor  ya  sea  de  un  cuarto,  un  medio  y  tres  cuartos  de  la 
distancia  entre  estas  dos  mediciones. 

Repertorio  de  ejercicios 

A.  A  continuacion  encontrara  dos  conjuntos  de  datos  de  practica.  Llene  los  espacios 
en  bianco  para  hallar  los  cuartiles  necesarios.  El  primer  conjunto  de  datos  ya  esta 
hecho. 


Conjunto  de  datos 

Ordenado 

n 

Posicion 
de  Q, 

Posicion 
de  ft 

Cuartil 
inferior,  ft 

Cuartil 
superior,  03 

2, 5, 7, 1,1, 2, 8 

5, 0, 1, 3, 1, 5, 5, 2, 4, 4, 1 

B.  A  continuacion  encontrara  tres  conjuntos  de  datos  que  ha  estan  ordenados.  Las 
posiciones  de  los  cuartiles  superior  e  inferior  se  muestran  en  la  tabla.  Encuentre 
las  mediciones  un  poco  arriba  y  un  poco  debajo  de  la  posicion  de  cuartil.  Ense- 
guida  encuentre  los  cuartiles  superior  e  inferior.  El  primer  conjunto  de  datos  ya 
esta  hecho. 


Conjunto  ordenado 
de  datos 

Posicion 
de  0, 

Mediciones 
arriba  y  abajo 

ft 

Posicion 
de  ft 

Mediciones 
arriba  y  abajo 

ft 

0,1,4, 4, 5,9 

1.75 

Oyl 

0  +  .75(1)  = 

.75 

5.25 

5y  9 

5  +  .25(4) 
=  6 

0,1, 3, 3, 4, 7, 7,8 

2.25 

y 

6.75 

y 

1,1, 2, 5, 6,6,7, 9,9 

2.5 

y 

7.5 

y 

Las  secciones  Mi  entrenador  personal,  con  repertorio  de  ejercicios,  son  frecuentes  en  los 
primeros  capitulos  donde  es  importante  establecer  conceptos  basicos  y  el  pensamiento  esta- 
distico,  acoplados  con  calculos  directos.  Las  respuestas  al  Repertorio  de  ejercicios,  cuando 
son  necesarias,  se  encuentran  en  la  parte  posterior  del  texto.  Las  secciones  Mi  entrenador 
personal  aparecen  en  todos  los  capitulos  excepto  en  dos:  capitulos  13  y  15.  Sin  embargo, 
los  conjuntos  de  problemas  de  repertorio  de  ejercicios  aparecen  solo  en  los  primeros 
10  capitulos  donde  los  problemas  se  pueden  resolver  con  lapiz  y  papel,  o  una  calcula- 
dora.  Esperantos  que  al  momento  en  que  un  alumno  haya  completado  estos  10  capitulos,  ya 
domine  los  conceptos  y  metodos  estadisticos.  Ademas,  la  naturaleza  intensiva  en  cuanto 
al  uso  de  la  computadora  en  los  capitulos  restantes  no  es  accesible  para  una  serie  de  ejerci¬ 
cios  repetitivos  simples  y  de  facil  calculo,  sino  mas  bien  es  posible  para  un  metodo  integral; 
es  decir,  una  sintesis  de  los  resultados  de  un  analisis  completo  en  un  conjunto  de  conclusio- 
nes  y  recomendaciones  para  el  experimentador. 

Otras  caracteristicas  de  la  decima 
tercera  edicion 

•  Mi  applet:  el  facil  acceso  a  la  Internet  ha  hecho  posible  que  los  alumnos  visualicen 
conceptos  estadisticos  por  medio  de  una  herramienta  interactiva  de  la  red  llamada 
applet.  Los  applets,  escritos  por  Gary  McClelland,  autor  de  Seeing  Statistics™,  han 
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sido  personalizados  en  especffico  para  relacionar  la  presentation  y  notation  em- 
pleadas  en  esta  edition.  Los  applets  se  hallan  en  Companion  Website  y  se  puede 
tener  acceso  a  ellos  por  medio  de  un  explorador  como  Internet  Explorer  o  Netscape 
Navigator,  estos  proporcionan  un  refuerzo  visual  de  los  conceptos  presentados  en  el 
texto.  Los  applets  permiten  que  el  usuario  lleve  a  cabo  un  experimento  estadfstico, 
interactue  con  una  grafica  estadistica  para  cambiar  su  forma  o  tenga  acceso  a  una 
“tabla  estadistica”  interactiva.  En  puntos  apropiados  del  texto  se  muestra  y  explica 
como  insertar  datos  para  cada  applet,  y  se  motiva  a  los  alumnos  a  aprender  a  interac- 
tuar  mediante  los  ejercicios  “Mi  applet”  al  final  de  cada  capitulo.  Estamos  entusias- 
mados  por  tener  estos  applets  integrados  en  la  pedagogia  estadistica,  y  esperamos 
que  usted  saque  ventaja  del  atractivo  visual  de  estos  applets  para  sus  alumnos. 


^  APPLET 

Se  puede  comparar  la  precision  de  estimadores  de  la  varianza  poblacional  o2  usando 
el  applet  Why  Divide  by  n  —  1?  El  applet  selecciona  muestras  de  una  poblacion  con 
desviacion  estandar  cr  =  29.2.  A  continuacion  calcula  la  desviacion  estandar  s  usando 
in  —  1)  en  el  denominador  asi  como  una  desviacion  estandar  calculada  usando  n 
en  el  denominador.  Se  puede  escoger  para  comparar  los  estimadores  para  una  sola 
muestra  nueva,  para  10  muestras  o  para  100  muestras.  Observe  que  cada  una  de  las 
10  muestras  que  aparecen  en  la  figura  2.9  tiene  una  desviacion  estandar  diferente. 
No  obstante,  cuando  las  10  desviaciones  estandar  se  promedian  en  la  parte  inferior 
del  applet,  uno  de  los  dos  estimadores  es  mas  cercano  a  la  desviacion  estandar  de  la 
poblacion  cr  =  29.2.  ^Cual  es?  Usaremos  este  applet  otra  vez  para  los  ejercicios  Mi 
Applet  al  final  del  capitulo. 


FIGURA  2.9 

Applet  Why  Divide  by 
n  —  1?  (iPor  que  dividir 
entre  n  —  M) 


Resulb  iJi>pljved  fui  Ini  10  Mitiplo  of  wxr 3 
81  Dev.  when  dividing  by  n  1 

38  0  42  8  33.7  13.3  20.0  14.2  9.0  23.3  9.3  32.7 
Cl  Dev.  when  dividing  by  n 

31.5  34  0  27  5  110  21.2  11.6  7  4  10.0  7  .6  26  7 
Avenue*  uf  SL  Dev  fium  ell  10  miiiiiIo. 


10  Sampl 


a 


100  Sampl 


Jp)  APPLET  Ejercicios 

2.86  Consulte  el  Conjunto  de  Datos  #  1  en  el  applet 
How  Extreme  Values  Affect  the  Mean  and  Median. 
(Como  afectan  los  valores  extremos  a  la  media  y  a  la 
mediana).  Este  applet  se  carga  con  una  grafica  de  puntos 
para  las  siguientes  n  =  5  observaciones:  2,  5,  6,  9,  11. 

a.  ^Cuales  son  la  media  y  la  mediana  para  este  conjunto 
de  datos? 

b.  Use  su  mouse  para  cambiar  el  valor  x  =  1 1  (el  punto 
verde  movible)  a  x  =  13.  ^Cuales  son  la  media  y 
mediana  para  el  nuevo  conjunto  de  datos? 

c.  Use  su  mouse  para  mover  el  punto  verde  a  x  =  33. 
Cuando  el  valor  maximo  es  sumamente  grande  en 
comparacion  con  las  otras  observaciones,  ^cual  es 
mayor,  la  media  o  la  mediana? 

d.  ^Que  efecto  tiene  un  valor  extremadamente  grande 
sobre  la  media?  ^Que  efecto  tiene  sobre  la  mediana? 

2.87  Consulte  el  Conjunto  de  Datos  #2  en  el  applet 
How  Extreme  Values  Affect  the  Mean  and  Median. 
Este  applet  se  carga  con  una  grafica  de  puntos  para  las 
siguientes  n  =  5  observaciones:  2,  5,  10,  11,  12. 

a.  Use  su  mouse  para  mover  el  valor  x  —  12  a  la 
izquierda  hasta  que  sea  menor  que  el  valor  x  =  1 1 . 

b.  A  medida  que  el  valor  de  x  se  hace  mas  pequeno,  ^que 
pasa  a  la  media  muestral? 


selecciona  al  azar  una  muestra  de  n  =  3  de  una  poblacion 
en  la  que  la  desviacion  estandar  es  cr  =  29.2. 

a.  De  un  clic  en  Aparecera  una  muestra 

formada  de  n  =  3  observaciones.  Use  su  calculadora 
para  verificar  los  valores  de  la  desviacion  estandar 
cuando  divida  entre  n  —  1  y  n  se  muestra  en  el  applet. 

b.  De  un  clic  en  [T^ti  -.ry-ijJ  otra  vez.  Calcule  el  promedio 
de  las  dos  desviaciones  estandar  (dividiendo  entre 

n  —  1)  de  los  incisos  a)  y  b).  Repita  el  proceso  para 
las  dos  desviaciones  estandar  (dividiendo  entre  n). 
Compare  sus  resultados  con  los  que  se  muestran  en 
rojo  en  el  applet. 

c.  Usted  puede  ver  como  los  dos  estimadores  del 
inciso  a)  se  comportan  “a  la  larga”  si  da  un  clic  en 

1  o  en  ~rl  varias  veces,  hasta  que  el 

promedio  de  todas  las  desviaciones  estandar  empiece 
a  estabilizarse.  ^Cual  de  los  dos  metodos  da  una 
desviacion  estandar  mas  cercana  a<r  =  29.2? 

d.  A  la  larga,  ^a  que  distancia  esta  la  desviacion  estandar 
cuando  divide  entre  n? 

2.90  Consulte  el  applet  Why  Divide  by  n  —  1.  El 
segundo  applet  de  la  pagina  al  azar  selecciona  una 
muestra  de  n  =  10  de  la  misma  poblacion  en  la  que  la 
desviacion  estandar  es  cr  =  29.2. 
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•  La  description  de  datos  graficos  y  numericos  incluye  metodos  tradicionales  y 
EDA,  con  grahcas  de  computadora  generadas  por  MINITAB  14  para  Windows. 


FIGURA  2.12 

Histograma  MINITAB  para 
el  ejemplo  2.8 


Estadistica  descriptiva:  x 

Variable  N  N*  Mean  SE  Mean  StDev  Minimum  Q1  Median  Q3  Maximum 

X  10  0  13.50  1.98  6.28  4.00  8.75  12.00  18.50  25.00 


FIGURA  2.1  6 

Salida  MINITAB  para  los 
datos  del  ejemplo  2.13 


•  La  presentation  del  capitulo  4  ha  sido  reescrita  para  aclarar  la  presentation  de  su- 
cesos  simples  y  el  espacio  muestral,  asi  como  la  presentation  de  la  probabilidad 
conditional,  independencia  y  la  regia  de  la  multiplication. 

•  Todos  los  ejemplos  y  ejercicios  del  texto  contienen  nuevas  impresiones  basadas 
en  MINITAB  14.  Los  resultados  impresos  de  MINITAB  se  proporcionan  para  algunos 
ejercicios,  mientras  que  otros  requieren  que  el  alumno  obtenga  soluciones  sin 
usar  la  computadora. 


c.  Use  una  grafica  de  lfnea  para  describir  el  numero  1  -53  Resultados  de  elecciones,  continua  Consulte 

pronosticado  de  instalaciones  domesticas  aldmbricas  l°s  ejercicios  1.51  y  1.52.  Las  siguientes  graficas  de 

para  los  anos  2002  a  2008.  tallo  y  hoja  fueron  generadas  usando  el  MINITAB  para 

d.  Use  una  grafica  de  lfnea  para  describir  el  numero  las  variables  llamadas  “Voto  popular”  y  “Porcentaje  de 

pronosticado  de  instalaciones  domesticas  inalambricas  Votos  . 

para  los  anos  2002  a  2008.  Pantalla  de  tallo  y  hoja:  Voto  popular 

(®)o«ros  1.51  Resultados  de  elecciones  Las 

EX0151  elecciones  de  2004  fueron  una  carrera  en  la  stem- and- leaf  of  stem-and-leaf  of 

,  Popular  Vote  N  =  50  Percent  Vote  N  =  50 

que  el  titular,  George  W.  Bush,  derroto  a  John  Kerry,  leaf  Dnit  .  100  Leaf  Unit  = 

Ralph  Nader  y  otros  candidates,  recibiendo  50.7%  de  la 

.  .  70  1111111  3  3  799 

votacion.  El  voto  popular  (en  miles)  para  George  W.  Bush  12  022333  8  403444 

en  cada  uno  de  los  50  estados  aparece  a  continuation:8  is  0444555  19  4  55666788899 

AL  1176  I  HI  194  1  MA  1071  NM  377  1  SD  233  22  0  6667  <9)  5  001122344 

«  ™  NY  2962  TN  ,384  2  ?  lllx  ”  “ 

AZ  1104  IL  2346  MN  1347  NC  1961  TX  4527 

AR  573  IN  1479  MS  685  ND  197  UT  664  15  i  444  173 

CA  5510  IA  572  MO  1456  OH  2860  VT  121  12  x  67 

CO  1101  KS  736  MT  266  OK  960  VA  1717  10  x  99 

CT  694  KY  1069  NE  513  OR  867  WA  1305  8  2 

DE  172  LA  1102  NV  419  PA  2794  WV  424  s  2  33 

FL  3965  ME  330  NH  331  Rl  169  Wl  1478  6  2 

GA  1914  1  MD  1025  1  NJ  1670  SC  938  1  WY  168  6  2  7 

5  2  89 

a.  Con  solo  mirar  la  tabla,  ^que  forma  piensa  usted  que  HI  3g  45  55 

tendra  la  distribucion  de  datos  para  el  voto  popular  por 

estado?  a.  Describa  las  formas  de  las  dos  distribuciones.  ^Hay 

b.  Trace  un  histograma  de  frecuencia  relativa  para  resultados  atfpicos? 

describir  la  distribucion  del  voto  popular  para  el  b.  ^Las  graficas  de  tallo  y  hoja  se  asemejan  a  los 

presidente  Bush  en  los  50  estados.  histogramas  de  frecuencia  relativa  construidos  en 

c.  qEl  histograma  del  inciso  b)  confirma  el  calculo  l°s  ejercicios  1.51  y  1.52? 

de  usted  en  el  inciso  a)?  ^Hay  resultados  atfpicos?  c.  Explique  por  que  la  distribucion  del  voto  popular  para 

i,Como  puede  explicarlos?  el  presidente  Bush  por  estado  esta  sesgada,  en  tanto 
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El  papel  de  la  computadora  en  la  decima 
tercera  edicion:  Mi  MINITAB 

En  la  actualidad  las  computadoras  son  una  herramienta  comu  n  para  alumnos  universita- 
rios  de  todas  las  disciplinas.  La  mayor  parte  de  ellos  son  consumados  usuarios  de  proce- 
sadores  de  texto,  hojas  de  calculo  y  bases  de  datos,  y  no  tienen  problema  para  navegar  a 
traves  de  paquetes  de  software  en  el  ambiente  Windows.  Sin  embargo,  creemos  que  las 
ventajas  de  la  tecnologfa  de  las  computadoras  no  deben  convertir  el  analisis  estadistico  en 
una  “caja  negra”.  Ademas,  se  eligio  usar  los  comandos  directos  y  las  herramientas  visuales 
interactivas  que  proporciona  la  tecnologfa  moderna  para  darnos  mas  tiempo  para  el  razo- 
namiento  estadistico,  asf  como  la  comprension  e  interpretation  de  resultados  estadfsticos. 

En  esta  edicion  los  alumnos  podran  usar  la  computadora  para  hacer  analisis  es- 
tadfstico  estandar  y  como  una  herramienta  para  reforzar  y  visualizar  conceptos 
estadfsticos.  MINITAB  14  para  Windows  se  emplea  exclusivamente  como  el  software 
para  analisis  estadistico.  Casi  todas  las  graficas  y  figuras,  asf  como  su  resultado  im- 
preso,  se  generan  con  esta  version  de  MINITAB.  Sin  embargo,  se  ha  elegido  aislar  las 
instrucciones  para  general-  este  resultado  en  secciones  individuales  llamadas  “Mi 
MINITAB”  al  final  de  cada  capftulo.  En  cada  description  se  usan  ejemplos  numericos 
para  guiar  al  alumno  por  los  comandos  y  opciones  de  MINITAB  necesarios  para  los 
procedimientos  presentados  en  ese  capftulo.  Se  han  incluido  referencias  para  captura  en 
pantallas  visuales  de  MINITAB  14,  asf  que  el  alumno  puede  trabajar  en  estas  secciones 
como  “minilaboratorios”. 


MINITAB 


Medidas  numericas  descriptivas 


FIGURA  2.21 


El  MINITAB  da  casi  todas  las  estadfsticas  descriptivas  basicas  presentadas  en  el  capf- 
tulo  2  usando  un  solo  comando  en  los  menus  descendentes.  Una  vez  que  usted  este  en 
el  escritorio  de  Windows,  de  un  doble  clic  en  el  icono  MINITAB  o  use  el  boton  Start  para 
iniciar  el  MINITAB. 

Practique  introduciendo  algunos  datos  en  la  ventana  Data,  dando  nombre  apropiado 
a  las  columnas  en  la  celda  gris  que  esta  un  poco  abajo  del  numero  de  columna.  Cuan- 
do  haya  terminado  de  introducir  sus  datos,  habra  creado  una  hoja  de  trabajo  MINITAB, 
que  se  puede  guardar  ya  sea  en  forma  individual  o  como  proyecto  MINITAB  para  uso 
futuro.  De  un  clic  en  File  — »  Save  Current  Worksheet  o  en  File  — »  Save  Project.  Ne- 
cesitara  aplicar  nombre  a  la  hoja  de  trabajo  (o  proyecto),  quiza  “datos  de  prueba”,  para 
que  pueda  recuperarla  mas  adelante. 

Los  datos  siguientes  son  las  longitudes  de  piso  (en  pulgadas)  detras  de  los  asientos 
segundo  y  tercero  de  nueve  minivans  diferentes:12 

Segundo  asiento:  62.0,  62.0,  64.5,  48.5,  57.5,  61.0,  45.5,  47.0,  33.0 

Tercer  asiento:  27.0,  27.0,  24.0,  16.5,  25.0,  27.5,  14.0,  18.5,  17.0 

Como  los  datos  contienen  dos  variables,  introducimos  las  dos  filas  de  numeros  en  las 
columnas  Cl  y  C2  de  la  hoja  de  trabajo  MINITAB  y  les  damos  los  nombres  “2o  asiento” 
y  “3er  asiento”,  rp.snprtivamp.ntp  TTsando  Ins  mpnris  Hpsrpndpnfpt;  Hp  un  rlir  pn  Stat  - 
Basic  Statistics 
la  figura  2.21. 

saffll 


1-1.1  WhlP-MV 


category  scales”.  Multiple  Graphs  da  opciones  de  impresion  para  multiples  graficas 
de  caja.  Labels  permite  poner  notas,  tftulos  y  notas  al  pie  en  la  grafica.  Si  ya  ha  introdu- 
cido  datos  en  la  hoja  de  trabajo  como  distribution  de  frecuencia  (valores  en  una  colum¬ 
na,  frecuencias  en  otra),  las  Data  Options  permitiran  leer  los  datos  en  ese  formato.  La 
grafica  de  caja  para  las  longitudes  del  tercer  asiento  se  muestra  en  la  figura  2.24. 

Usted  puede  usar  los  comandos  de  MINITAB  del  capftulo  1  para  mostrar  graficas  de 
tallo  y  hojas  o  histogramas  para  las  dos  variables.  ^Como  describirfa  las  similitudes  y  las 
diferencias  en  estos  dos  conjuntos  de  datos?  Guarde  esta  hoja  de  trabajo  en  un  archivo 
llamado  “Minivans”  antes  de  salir  de  MINITAB.  Volvera  a  usarlo  en  el  capftulo  3. 


FIGURA  2.22 


Dascriptlv*  Statistics:  2nd  Scat,  3rd  S«at 


I  Vuisble 
I  2nd  less 
I  s*it 


S3. 44 

21.  M 


SE  Be  m  !tl<v  Bssvmun 
3.  SI  10.14  33.00 

1.77  ».»  14.00 


01 
44.2$ 
11.  U 


Scdiic  03  Hbcibu* 
17.  JO  (2.00  (4.  SO 

24.00  27.00  27.  SO 
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Si  no  necesita  el  conocimiento  “practico”  de  MINITAB,  o  si  esta  utilizando  otro  paquete 
de  software,  omita  estas  secciones  y  use  las  impresiones  de  MINITAB  como  gufas  para 
la  comprension  basica  de  los  resultados  impresos  de  computadora. 

A  cualquier  alumno  que  tenga  acceso  a  una  computadora  con  un  explorador  como 
Internet  Explorer  o  Netscape  Navigator  le  son  utiles  los  applets  encontrados  en  el 
Companion  Website  para  visualizar  diversos  conceptos  estadfsticos.  Ademas,  algunos 
de  los  applets  se  pueden  usar  en  lugar  del  software  de  computadora  para  llevar  a  cabo 
analisis  estadfsticos  simples.  Los  ejercicios  escritos  para  su  uso  con  estos  applets  apa- 
recen  en  una  section  al  final  de  cada  capftulo.  Los  alumnos  pueden  usar  los  applets 
en  casa  o  en  un  laboratorio  de  computo,  a  medida  que  lean  el  material  del  texto,  una 
vez  que  hayan  terminado  de  leer  todo  el  capftulo,  o  como  una  herramienta  para  repaso 
de  examen.  Los  instructores  tienen  la  posibilidad  de  asignar  ejercicios  de  applets  a  los 
estudiantes,  y  usarlos  como  una  herramienta  en  un  entorno  de  laboratorio  o  para  de- 
mostraciones  visuales  durante  las  clases.  Creemos  que  estos  applets  seran  una  poderosa 
herramienta  que  ampliara  el  entusiasmo  y  la  comprension  del  alumno  en  los  conceptos 
y  procedimientos  estadfsticos. 


MATERIAL  DE  APOYO 
PARA  EL  ESTUDIO 

Los  numerosos  y  variados  ejercicios  del  texto  suministran  la  mejor  herramienta  de 
aprendizaje  para  estudiantes  que  inician  un  primer  curso  de  estadfstica.  Cada  ejercicio 
de  aplicaciones  ahora  tiene  un  tftulo,  lo  que  facilita  a  alumnos  y  profesores  identificar 
de  inmediato  tanto  el  contexto  del  problema  como  su  area  de  aplicaciones. 


APLICACIONES 

5.43  Seguridad  en  un  aeropuerto  El  mayor 
numero  de  pequenos  aviones  de  vuelos  cortos  en 
aeropuertos  importantes  ha  aumentado  la  preocupacion 
por  la  seguridad  en  el  aire.  Un  aeropuerto  de  la  region 
este  ha  registrado  un  promedio  mensual  de  cinco 
accidentes  que  casi  ocurren  en  aterrizajes  y  despegues 
en  los  ultimos  5  anos. 

a.  Encuentre  la  probabilidad  de  que  durante  un  mes 
determinado  no  haya  accidentes  que  casi  ocurren  en 
aterrizajes  y  despegues  en  el  aeropuerto. 


c.  Un  nino  sufrira  a  lo  sumo  una  lesion  durante  el  ano. 

5.46  Propenso  a  accidentes,  continua  Consulte 
el  ejercicio  5.45. 

a.  Calcule  la  media  y  desviacion  estandar  para  x,  el 
numero  de  lesiones  por  ano  sufridas  por  un  nino  en 
edad  escolar. 

b.  (jDentro  de  que  lunites  esperarfa  usted  que  caiga  el 
numero  de  lesiones  por  ano? 

5.47  Bacterias  en  muestras  de  agua  Si  una 
gota  de  agua  se  pone  en  la  platina  y  se  examina  bajo  un 
microscopio,  el  numero  x  de  un  tipo  particular  de  bacteria 


Se  debe  alentar  a  los  alumnos  a  usar  las  nuevas  secciones  Mi  entrenador  personal 
y  los  Repertorios  de  ejercicios  siempre  que  aparezcan  en  el  texto.  Los  estudiantes 
pueden  “llenar  los  espacios  en  bianco”  escribiendo  directamente  en  el  texto  y  obtener 
retroalimentacion  inmediata  comprobando  las  respuestas  en  la  parte  posterior  del  libro. 
Ademas,  hay  numerosas  sugerencias  practicas  llamadas  Mi  consejo  que  aparecen  en 
los  margenes  del  texto. 


CONSEJO 

Regia  empirics  <=>  datos  en 
forma  de  monticulo. 
Chebyshev  <=>  datos  en 
cualquier  forma. 


^Es  aplicable  el  teorema  de  Chebyshev?  Si,  porque  se  puede  usar  para  cualquier  con- 
junto  de  datos.  De  acuerdo  con  el  teorema  de  Chebyshev, 

•  al  menos  3/4  de  las  mediciones  caeran  entre  10.6  y  32.6. 

•  al  menos  8/9  de  las  mediciones  caeran  entre  5.1  y  38.1. 
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Las  secciones  Mi  applet  aparecen  dentro  del  cuerpo  del  texto  y  explican  el  uso  de 
un  applet  de  Java.  Por  ultimo,  las  secciones  llamadas  Conceptos  clave  y  formulas 
aparecen  en  cada  capitulo  como  un  repaso  a  manera  de  esbozo  del  material  cubierto 
en  ese  capitulo. 


REPASO  DEL  CAPITULO 


Conceptos  clave  y  formulas 

I.  Medidas  de  centro  de  una  distribution 
de  datos 

1.  Media  aritmetica  (media)  o  promedio 

a.  Poblacion:  ix 

-  Xxi 

b.  Muestra  de  n  mediciones:  x  = 


2.  Mediana;  posicion  de  la  mediana  =  .5 («  +1) 

3.  Moda 

4.  La  mediana  puede  ser  preferida  a  la  media  si  los 
datos  son  altamente  sesgados. 


II.  Medidas  de  variabilidad 

1.  Rango:  R  =  maximo  —  mi'nimo 

2.  Varianza 

a.  Poblacion  de  N  mediciones: 

%(Xi  -  rf 
o  = - 


b.  Muestra  de  n  mediciones: 

(W 


.  X(X,  -  xf 
n  -  1 


Xx2i-K- 


montfculo.  Aproximadamente  68%,  95%  y 
99.7%  de  las  mediciones  estan  a  no  mas  de  uno, 
dos  y  tres  desviaciones  estandar  de  la  media, 
respectivamente. 

IV.  Mediciones  de  posicion  relativa 

1.  Puntaje  z  muestral:  z  —  X  y— — 

2.  p-esimo  percentil;  p%  de  las  mediciones  son  mas 
pequenas  y  (100  —  p)%  son  mas  grandes. 

3.  Cuartil  inferior,  Qx\  posicion  de  Qx  — 

.25  (n  +  1) 

4.  Cuartil  superior,  Q3\  posicion  de  Q3  = 

.75  ( n  +  1) 

5.  Rango  intercuartil:  IQR  =  Q3  —  Qx 

V.  El  resumen  de  cinco  numeros 

y  graficas  de  caja 

1.  El  resumen  de  cinco  numeros: 

Min  Qx  Mediana  Q3  Max 

Un  cuarto  de  las  mediciones  del  conjunto  de  datos 
esta  entre  cada  uno  de  los  cuatro  pares  adyacentes 
de  numeros. 

2.  Se  usan  graficas  de  caja  para  detectar  resultados 


El  Companion  Website  proporciona  a  los  alumnos  una  coleccion  de  recursos  de  es- 
tudio,  que  incluyen  un  conjunto  completo  de  applets  de  Java  utilizados  para  las  secciones 
Mi  applet,  PowerPoint®  slides  (diapositivas  en  Power  Point)  para  cada  capitulo,  data  sets 
(conjunto  de  datos)  para  muchos  de  los  ejercicios  del  texto  guardados  en  distintos  formatos 
y  un  Graphing  Calculator  Manual  (manual  de  calculadora  graficadora),  que  incluye 
instrucciones  para  llevar  a  cabo  muchas  de  las  tecnicas  del  texto  con  la  popular  calcula¬ 
dora  graficadora  TI-83.  Ademas,  se  incluyen  conjuntos  de  Practice  (or  Self-Correcting) 
Exercises  (ejercicios  de  practica  o  autocorreccion)  para  cada  capitulo.  Estos  conjuntos  de 
ejercicios  van  seguidos  de  las  soluciones  completas  para  cada  uno.  Estas  soluciones  son 
utiles  para  la  pedagogia  en  cuanto  que  permiten  a  los  alumnos  precisar  cualquier  error 
cometido  en  cada  uno  de  los  pasos  del  calculo  que  llevan  a  las  respuestas  finales.  Los 
estudiantes  tendran  acceso  tambien  al  Companion  Website  (sitio  web  adjunto)  especifico 
del  texto  que  contiene  los  conjuntos  de  datos  y  de  pruebas  interactivas  en  la  red. 
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RECURSOS  PARA  EL  PROFESOR 

El  Instructor’s  Companion  Website  (academic.cengage.com/statistics/mendenhall)  dis- 
ponible  para  los  usuarios  de  la  decimo  tercera  edicion,  ofrece  una  variedad  de  ayudas 
didacticas,  incluyendo 

•  Todo  el  material  del  Student  Companion  Website,  que  anade  ejercicios  usando 
el  Large  Data  Sets,  el  cual  es  acompanado  por  tres  grandes  conjuntos  de  datos 
que  pueden  utilizarse  durante  todo  el  curso.  Un  archivo  denominado  "Fortune" 
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Introduccion 

Entrene  su  cerebro 
para  la  estadistica 


(iQue  es  estadistica?  ^Ha  conocido  usted  alguna  vez  a  un 
experto  en  estadistica?  <\Sabe  usted  que  hace?  Quiza  esta 
pensando  en  la  persona  que  se  sienta  en  la  cabina  de  trans- 
misiones  del  Tazon  de  las  Rosas,  registrando  el  numero 
de  pases  completos,  yardas  por  tierra  o  intercepciones 
lanzadas  el  dia  de  Ano  Nuevo.  O  quiza  la  simple  mencion 
de  la  palabra  estadistica  le  causa  temor  a  usted.  Puede  que 
piense  que  no  sabe  usted  nada  de  estadistica,  pero  es  casi 
inevitable  que  encuentre  estadisticas  en  una  forma  u  otra 
cada  vez  que  tome  un  periodico.  Veamos  un  ejemplo: 


Encuestas  ven  que  los  republicanos  mantienen 
control  del  Senado 

NUEVA  YORK.  A  unos  cuantos  dias  de  elecciones  de  mitad 
de  mandato,  la  ronda  final  de  votaciones  de  la  MSNBC/Mc- 
Clatchy  muestra  una  carrera  mas  apretada  en  la  batalla  por 
el  control  del  Senado  de  Estados  Unidos.  Los  democratas 
van  a  la  cabeza  en  varias  carreras  que  podrian  resultar  en  la 
recuperation  del  partido,  pero  los  republicanos  han  reducido 
la  brecha  en  las  otras  carreras,  segun  encuestas  de  Mason- 
Dixon  en  12  estados.  En  total,  estas  carreras  clave  del  Senado 
muestran  lo  siguiente: 


•  Dos  republicanos  titulares  en  serios  problemas:  Santorum 
y  DeWine.  Los  democratas  pueden  ganar  dos  asientos. 

•  Cuatro  republicanos  titulares  esencialmente  ligados  a  sus 
oponentes:  Allen,  Burns,  Chafee  y  Talent.  Cuatro  probabili- 
dades  que  podrian  convertirse  en  victorias  democratas. 

•  Tres  titulares  democratas  con  liderazgo:  Cantwell,  Menen- 
dez  y  Stabenow. 

•  Un  republicano  titular  delante  de  su  oponente:  Kyi. 

•  Un  asiento  republicano  abierto  con  el  republicano  a  la 
cabeza:  Tennessee. 

•  Un  asiento  democrata  abierto  practicamente  empatado: 
Maryland. 
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Los  resultados  muestran  que  los  democratas  tienen  buenas  probabilidades  de  ganar  al  menos  dos 
asientos  en  el  Senado.  Hasta  ahora,  deben  ganar  cuatro  de  los  asientos  probables  y  al  mismo  tiem- 
po  sostenerse  en  Maryland  para  ganar  el  control  del  Senado.  Un  total  de  625  probables  votantes 
en  cada  estado  fueron  entrevistados  por  telefono.  El  margen  de  error,  segun  normas  que  por  lo 
general  usan  los  estadfsticos,  es  no  mayor  al  4%  de  puntos  en  cada  votacion. 

— www.msnbc.com1 

Artfculos  semejantes  a  este  son  comunes  en  nuestros  diarios  y  revistas  y,  en  el  periodo 
inmediato  anterior  a  la  eleccion  presidencial,  casi  todos  los  dfas  se  publica  una  nueva 
encuesta.  De  hecho,  en  la  eleccion  nacional  del  7  de  noviembre,  los  democratas  pudieron 
controlar  la  camara  de  representantes  y  la  del  Senado  de  Estados  Unidos.  El  lenguaje  de 
este  articulo  es  muy  conocido  para  todos,  pero  deja  al  lector  curioso  con  algunas  pre- 
guntas  sin  contestar.  Como  fueron  seleccionadas  las  personas  en  la  encuesta?  Estas 
personas  daran  la  misma  respuesta  manana?  ^Daran  la  misma  respuesta  el  dfa  de  la 
eleccion?  ^Votaran,  incluso?  ^Son  representativas  de  todos  quienes  votaran  el  dfa  de 
la  eleccion?  Es  trabajo  de  un  estadfstico  hacer  estas  preguntas  y  hallar  respuestas  para 
ellas  en  el  lenguaje  de  la  encuesta. 

Casi  todos  piensan  de  “encubrimiento”  en  datos  del  asesinato  de  JFK 

La  mayor  parte  del  publico  piensa  que  el  asesinato  del  presidente  John  F.  Kennedy  fue  parte  de 
una  conspiracion  mas  grande,  no  el  acto  de  un  individuo.  Ademas,  casi  todos  los  estadounidenses 
piensan  que  fue  un  encubrimiento  de  datos  acerca  de  los  disparos  de  1963.  Mas  de  40  anos  des¬ 
pues  del  asesinato  de  JFK.  una  encuesta  de  FOX  News  muestra  que  casi  todos  los  estadounidenses 
estan  en  desacuerdo  con  las  conclusiones  del  gobierno  acerca  del  crimen.  La  Comision  Warren 
encontro  que  Lee  Harvey  Oswald  actuo  solo  cuando  le  disparo  a  Kennedy,  pero  el  66%  del 
publico  piensa  hoy  que  el  asesinato  fue  “parte  de  una  conspiracion  mas  grande”  en  tanto  que  solo 
25%  piensan  que  fue  el  “acto  de  un  individuo”. 

“Para  los  estadounidenses  mas  viejos,  el  asesinato  de  Kennedy  fue  una  experiencia  traumatica 
que  empezo  con  la  perdida  de  confianza  en  el  gobierno”,  comento  John  Gorman,  presidente  de 
Opinion  Dynamics.  “Las  personas  mas  jovenes  han  crecido  con  pelfculas  y  documentales  que  han 
impulsado  mucho  la  linea  de  ‘conspiracion’.  Por  lo  tanto,  no  es  de  sorprender  que  haya  un  consen- 
so  nacional  mas  bien  solido  de  que  todavfa  no  sabemos  la  verdad.” 

(La  encuesta  pregunto):  “^Piensa  usted  que  conocemos  todos  los  datos  acerca  del  asesinato 
del  presidente  John  F.  Kennedy  o  piensa  que  fue  un  encubrimiento?” 


Conocemos  todos  los  datos 

Hubo  encubrimiento 

(No  esta  seguro) 

Todos 

14% 

74 

12 

Democratas 

11% 

81 

8 

Republicanos 

18% 

69 

13 

Independientes 

12% 

71 

17 

— www.foxnews.com2 

Cuando  usted  ve  un  articulo  como  este  en  una  revista,  ^simplemente  lee  el  tftulo  y  el 
primer  parrafo,  o  lee  mas  y  trata  de  entender  el  significado  de  los  numeros?  ^Como 
obtuvieron  estos  datos  los  autores?  En  realidad  entrevistaron  a  todos  los  estadouniden¬ 
ses  de  cada  afiliacion  polftica?  Es  trabajo  del  estadfstico  interpretar  el  lenguaje  de  este 
estudio. 

Noticias  de  ultima  hora:  98.6  no  es  normal 

Despues  de  creer  durante  mas  de  un  siglo  que  98.6  era  la  temperatura  corporal  normal  para  seres 
humanos,  los  investigadores  ahora  dicen  que  normal  ya  no  es  normal. 

Para  algunas  personas  a  ciertas  horas  del  dfa,  99.9  grados  podrfa  estar  bien.  Y  lecturas  de  solo 
96  resulta  que  son  muy  “humanas”. 

La  norma  de  98.6  fue  obtenida  por  un  medico  aleman  en  1868.  Algunos  medicos  siempre 
habfan  sospechado  de  la  investigacion  del  buen  doctor.  Su  duda:  un  millon  de  lecturas,  en  una 
epoca  sin  computadoras. 
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Enlonces,  Mackowiak  &  Co.  lomaron  lecluras  de  lemperalura  a  148  personas  sanas  en  un 
periodo  de  tres  dfas  y  encontraron  que  la  temperalura  media  era  de  98.2  grados.  Solo  8%  de  las 
lecturas  fue  de  98.6. 

— The  Press-Enterprise 3 

(Que  preguntas  le  vienen  a  la  mente  cuando  lee  este  articulo?  £  En  que  forma  el  inves- 
tigador  selecciono  las  148  personas,  y  como  podemos  estar  seguros  que  los  resultados 
basados  en  estas  148  personas  son  precisos  cuando  se  aplican  a  la  poblacion  en  general? 
(  Como  llego  el  investigador  a  las  temperaturas  normales  “alta”  y  “baja”  dadas  en  el 
articulo?  (  Como  registro  el  medico  aleman  un  millon  de  temperaturas  en  1 868?  Otra  vez 
encontramos  un  problema  estadistico  con  aplicaciones  en  la  vida  diaria. 

La  estadistica  es  una  rama  de  las  matematicas  que  tiene  aplicaciones  en  cada  toda 
faceta  de  nuestra  vida.  Es  un  lenguaje  nuevo  y  poco  conocido  para  casi  todas  las  perso¬ 
nas,  pero,  al  igual  que  cualquier  idioma  nuevo,  la  estadistica  puede  parecer  agobiante 
a  primera  vista.  Queremos  que  el  lector  “entrene  su  cerebro”  para  entender  este  nuevo 
lenguaje  paso  a  paso.  Una  vez  aprendido  y  entendido  el  lenguaje  de  la  estadistica,  vere- 
mos  que  es  una  poderosa  herramienta  para  el  analisis  de  datos  en  numerosos  campos  de 
aplicacion  diferentes. 


LA  POBLACION  Y  LA  MUESTRA 

En  el  lenguaje  de  la  estadistica,  uno  de  los  conceptos  mas  elementales  es  el  muestreo.  En 
casi  todos  los  problemas  de  estadistica,  un  numero  especificado  de  mediciones  o  datos,  es 
decir,  una  muestra,  se  toma  de  un  cuerpo  de  mediciones  mas  grande  llamado  poblacion. 


Para  el  experimento  de  la  temperatura  corporal,  la  muestra  es  el  conjunto  de  medicio¬ 
nes  de  temperatura  cotporal  para  las  148  personas  sanas  escogidas  por  el  experimentador. 
Esperamos  que  la  muestra  sea  representativa  de  un  conjunto  mucho  mayor  de  medicio¬ 
nes,  la  poblacion,  j  las  temperaturas  corporales  de  todas  las  personas  sanas  del  mundo! 

(Cual  es  el  interes  principal,  la  muestra  o  la  poblacion?  En  la  mayor  parte  de  los 
casos,  estamos  interesados  principalmente  en  la  poblacion,  pero  esta  puede  ser  dificil  o 
imposible  de  enumerar.  Imagine  tratar  de  registrar  la  temperatura  corporal  de  todas  las 
personas  sanas  del  mundo  o  ;de  la  preferencia  presidencial  de  todo  votante  registrado  en 
Estados  Unidos !  En  cambio,  tratamos  de  describir  o  pronosticar  el  comportamiento 
de  la  poblacion  con  base  en  informacion  obtenida  de  una  muestra  representativa  de 
esa  poblacion. 

Las  palabras  muestra  y  poblacion  tienen  dos  significados  para  la  mayoria  de  per¬ 
sonas.  Por  ejemplo,  usted  lee  en  los  periodicos  que  una  encuesta  Gallup  realizada  en 
Estados  Unidos  estuvo  basada  en  una  muestra  de  1823  personas.  Presumiblemente,  a 
cada  persona  entrevistada  se  le  hace  una  pregunta  particular  y  la  respuesta  de  esa  per¬ 
sona  representa  una  sola  medida  de  la  muestra.  qLa  muestra  es  el  conjunto  de  las  1823 
personas,  o  es  las  1823  respuestas  que  dan? 

Cuando  usamos  lenguaje  de  la  estadistica,  distinguimos  entre  el  conjunto  de  objetos  en 
el  cual  las  mediciones  se  toman  y  las  mediciones  mismas.  Para  experimentadores,  los 
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objetos  en  los  que  las  mediciones  se  toman  se  denominan  unidades  experimentales.  El 
estadfstico  que  estudia  las  muestras  las  llama  elementos  de  la  muestra. 


ESTADISTICAS  DESCRIPTIVAS 
E  INFERENCI ALES 


Cuando  primero  se  le  presenta  a  usted  un  conjunto  de  mediciones,  ya  sea  una  muestra 
o  una  poblacion,  necesita  encontrar  una  forma  de  organizarlo  y  resumirlo.  La  rama  de 
la  estadfstica  que  presenta  tecnicas  para  describir  conjuntos  de  mediciones  se  denomina 
estadfstica  descriptiva.  El  lector  ha  visto  estadfsticas  descriptivas  en  numerosas  formas: 
graficas  de  barras,  graficas  de  pastel  y  graficas  de  lfneas  presentadas  por  un  candidato 
politico;  tablas  numericas  en  el  periodico;  o  el  pro  medio  de  cantidad  de  lluvia  informa- 
do  por  el  pronosticador  del  clima  en  la  television  local.  Las  graficas  y  resumenes  numeri- 
cos  generados  en  computadoras  son  comunes  en  nuestra  comunicacion  de  todos  los  dias. 


Definicion  La  estadfstica  descriptiva  esta  formada  por  procedimientos  empleados 
para  resumir  y  describir  las  caracterfsticas  importantes  de  un  conjunto  de  mediciones. 


Si  el  conjunto  de  mediciones  es  toda  la  poblacion,  solo  es  necesario  sacar  conclusio- 
nes  basadas  en  la  estadistica  descriptiva.  No  obstante,  podrfa  ser  demasiado  costoso  o 
llevarfa  demasiado  tiempo  enumerar  toda  la  poblacion.  Quiza  enumerar  la  poblacion  la 
destruirfa,  como  en  el  caso  de  la  prueba  de  “tiempo  para  falla”.  Por  estas  y  otras  razones, 
quiza  el  lector  solo  tenga  una  muestra  de  la  poblacion  que,  al  verla,  usted  desee  contestar 
preguntas  acerca  de  la  poblacion  en  su  conjunto.  La  rama  de  la  estadistica  que  se  ocupa 
de  este  problema  se  llama  estadfstica  inferencial. 


Definicion  La  estadfstica  inferencial  esta  formada  por  procedimientos  empleados 
para  hacer  inferencias  acerca  de  caracterfsticas  poblacionales,  a  partir  de  informacion 
contenida  en  una  muestra  sacada  de  esta  poblacion. 


El  objetivo  de  la  estadfstica  inferencial  es  hacer  inferencias  (es  decir,  sacar  conclusio- 
nes,  hacer  predicciones,  tomar  decisiones)  acerca  de  las  caracterfsticas  de  una  poblacion 
a  partir  de  informacion  contenida  en  una  muestra. 


ALCANZAR  EL  OBJETIVO  DE 
ESTADISTICAS  INFERENCIALES: 

LOS  PASOS  NECESARIOS 

^Como  puede  hacer  inferencias  acerca  de  una  poblacion  utilizando  informacion  conte¬ 
nida  en  una  muestra?  La  tarea  se  hace  mas  sencilla  si  el  lector  se  entrena  para  organizar 
el  problema  en  una  serie  de  pasos  logicos. 


1 .  Especifique  las  preguntas  a  contestar  e  identifique  la  poblacion  de  interes. 

En  la  encuesta  de  eleccion  presidencial,  el  objetivo  es  determinar  quien  obtendra 
mas  votos  el  dfa  de  la  eleccion.  Por  lo  tanto,  la  poblacion  de  interes  es  el 
conjunto  de  todos  los  votos  en  la  eleccion  presidencial.  Cuando  usted  selecciona 
una  muestra,  es  importante  que  la  muestra  sea  representativa  de  esta  poblacion, 
no  la  poblacion  de  preferencias  de  votantes  del  5  de  julio  o  en  algiin  otro  dfa 
antes  de  la  eleccion. 

2.  Decida  como  seleccionar  la  muestra.  Esto  recibe  el  nombre  de  diseilo  del 
experimento  o  procedimiento  de  muestreo.  (',La  muestra  es  representativa  de  la 
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poblacion  de  interes?  Por  ejemplo,  si  una  muestra  de  votantes  registrados  se 
selecciona  del  estado  de  Arkansas,  ^esta  muestra  sera  representativa  de  todos 
los  votantes  de  Estados  Unidos?  <\Sera  lo  mismo  que  una  muestra  de  “probables 
votantes”,  es  decir,  aquellos  que  es  probable  que  en  realidad  voten  en  la  elec- 
cion?  La  muestra  es  lo  suficientemente  grande  para  contestar  las  preguntas 
planteadas  en  el  paso  1  sin  perder  tiempo  y  dinero  en  informacion  adicional?  Un 
buen  diseno  de  muestreo  contestara  las  preguntas  planteadas,  con  minimo  costo 
para  el  experimentador. 

3.  Seleccione  la  muestra  y  analice  la  informacion  muestral.  Sin  importar  cuanta 
informacion  contenga  la  muestra,  el  lector  debe  usar  un  metodo  de  analisis  apro- 
piado  para  extraerla.  Muchos  de  estos  metodos,  que  dependen  del  procedimiento 
de  muestreo  del  paso  2,  se  explican  en  el  texto. 

4.  Use  la  informacion  del  paso  3  para  hacer  una  inferencia  acerca  de  la 
poblacion.  Es  posible  usar  muchos  procedimientos  diferentes  para  hacer  esta 
inferencia  y  algunos  son  mejores  que  otros.  Por  ejemplo,  podrfa  haber  10  meto¬ 
dos  diferentes  para  estimar  la  respuesta  humana  a  un  medicamento  experimental, 
pero  un  procedimiento  podrfa  ser  mas  preciso  que  los  otros.  Usted  debe  usar  el 
mejor  procedimiento  disponible  para  hacer  inferencias  (muchos  de  estos  se  expli¬ 
can  en  el  texto). 

5.  Determine  la  confiabilidad  de  la  inferencia.  Como  usted  esta  usando  solo  una 
parte  de  la  poblacion  para  sacar  las  conclusiones  descritas  en  el  paso  4,  j  podrfa 
estar  en  un  error!  (:  C6mo  puede  ser  esto?  Si  una  agenda  realiza  una  encuesta  es- 
tadfstica  para  usted  y  estima  que  el  producto  de  su  companfa  ganara  34%  del 
mercado  este  ano,  ^cuanta  confianza  puede  usted  poner  en  esta  estimation?  ;,Es 
precisa  a  no  mas  de  1.5  o  a  20  puntos  porcentuales?  ^Es  confiable  lo  suficiente 
para  establecer  metas  de  production?  Toda  inferencia  estadfstica  debe  incluir  una 
medida  de  confiabilidad  que  dice  cuanta  confianza  tiene  usted  en  la  inferencia. 

Ahora  que  ya  ha  aprendido  algunos  de  los  terminos  y  conceptos  basicos  del  lenguaje 
de  la  estadfstica,  otra  vez  hacemos  la  pregunta  del  principio  de  este  analisis:  ^Sabe  usted 
que  hace  un  estadfstico?  Es  el  trabajo  del  estadfstico  poner  en  practica  todos  los  pasos 
precedentes.  Esto  puede  comprender  preguntar  al  experimentador  para  asegurarse  que  la 
poblacion  de  interes  este  claramente  definida,  desarrollar  un  plan  apropiado  de  muestreo 
o  diseno  experimental  para  dar  maxima  informacion  al  minimo  costo,  analizar  correc- 
tamente  y  sacar  conclusiones  usando  la  informacion  muestral  y,  por  ultimo,  medir  la 
confiabilidad  de  las  conclusiones  con  base  en  los  resultados  experimentales. 


ENTRENE  SU  CEREBRO 
PARA  LA  ESTADlSTICA 


A  medida  que  el  lector  avance  en  este  libro,  aprendera  cada  vez  mas  palabras,  frases 
y  conceptos  de  este  nuevo  lenguaje  de  estadfstica.  Los  procedimientos  estadfsticos,  en 
su  mayor  parte,  estan  formados  de  pasos  de  sentido  comun  que,  con  tiempo  suficiente, 
es  muy  probable  que  el  lector  haya  descubierto  por  sf  mismo.  Como  la  estadfstica  es 
una  rama  aplicada  de  las  matematicas,  muchos  de  los  conceptos  basicos  son  matema- 
ticos,  desarrollados  y  basados  en  resultados  de  calculo  o  de  matematicas  mas  elevadas. 
No  obstante,  usted  no  tiene  que  derivar  resultados  para  aplicarlos  en  una  forma  logi- 
ca.  En  este  texto  usamos  ejemplos  numericos  y  argumentos  intuitivos  para  explicar 
conceptos  estadfsticos,  en  lugar  de  argumentos  matematicos  mas  complicados. 

Para  ayudarle  en  su  entrenamiento  estadfstico,  hemos  incluido  una  section  llamada 
“Mi  entrenador  personal”  en  puntos  apropiados  del  texto.  Este  es  su  “entrenador  per- 
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sonal”,  que  le  llevara  paso  a  paso  por  algunos  de  los  procedimientos  que  tienden  a  ser 
confusos  para  numerosos  estudiantes.  Una  vez  que  lea  la  explication  paso  a  paso,  trate 
de  hacer  las  “Repeticiones  de  ejercicios”,  que  por  lo  general  aparecen  en  forma  de 
tabla.  Escriba  las  respuestas,  justo  en  su  libro  y  luego  verifique  sus  respuestas  contra 
las  respuestas  que  estan  al  final  del  libro.  Si  todavfa  tiene  problemas,  encontrara  mas 
“Repeticiones  de  ejercicios”  en  el  conjunto  de  ejercicios  para  esa  section.  Tambien  debe 
observar  las  sugerencias  de  estudio,  llamadas  “Mi  consejo”,  que  encontrara  al  margen 
del  texto  cuando  lea  el  capitulo. 

En  anos  recientes,  las  computadoras  se  han  hecho  facilmente  accesibles  para  muchos 
estudiantes  y  son  una  valiosa  herramienta.  En  el  estudio  de  estadisticas,  incluso  un  prin- 
cipiante  puede  usar  paquetes  de  programas  para  realizar  analisis  estadisticos  con  un  alto 
grado  de  rapidez  y  precision.  Algunos  de  los  paquetes  estadisticos  mas  comunes  que 
se  pueden  adquirir  en  centros  de  computo  son  el  MINITAB™,  SAS  (Statistical  Analysis 
System)  y  el  SPSS  (Statistical  Package  for  the  Social  Sciences);  las  computadoras  per- 
sonales  tienen  capacidad  para  paquetes  como  el  MINITAB,  MS  Excel  y  otros.  Hay  incluso 
programas  de  estadistica  en  linea  y  “applets”  interactivos  en  la  internet. 

Estos  programas.  llamados  software  de  estadistica,  difieren  en  los  tipos  de  analisis 
disponibles,  las  opciones  dentro  de  los  programas  y  las  formas  de  resultados  impresos 
(llamadas  salidas),  pero  todos  son  semejantes.  En  este  libro  usamos  principalmente  el 
MINITAB  como  herramienta  estadistica;  entender  la  salida  basica  de  este  paquete  ayudara 
al  estudiante  a  interpretar  la  salida  de  otros  sistemas  de  computo. 

Al  final  de  casi  todos  los  capitulos,  el  lector  encontrara  una  section  llamada  “Mi 
MINITAB”.  Estas  secciones  presentan  ejemplos  numericos  para  guiarlo  por  los  comandos 
del  MINITAB  y  opciones  que  se  usan  para  los  procedimientos  de  ese  capitulo.  Si  usted 
esta  usando  MINITAB  en  un  laboratorio  o  en  casa,  puede  trabajar  esta  section  en  su  propia 
computadora  para  que  se  familiarice  con  los  metodos  practicos  del  analisis  del  MINITAB. 
Si  no  necesita  conocimientos  practicos  del  MINITAB,  puede  escoger  saltarse  esta  section 
y  simplemente  usar  las  impresiones  del  MINITAB  para  analisis  cuando  aparezcan  en  el 
texto. 

Tambien  encontrara  una  section  llamada  “Mi  Applet”  en  muchos  de  los  capitulos. 
Estas  secciones  son  una  introduction  util  a  los  applets  estadisticos  que  hay  en  el  sitio 
web  Premium.  Usted  puede  usar  estos  applets  para  visualizar  muchos  de  los  concep- 
tos  de  capitulos  y  hallar  soluciones  a  ejercicios  en  una  nueva  section  llamada  “Ejerci¬ 
cios  de  Mi  Applet”. 

Mas  importante  aun  es  que  usar  la  estadistica  en  forma  satisfactoria  requiere  sentido 
comun  y  pensamiento  logico.  Por  ejemplo,  si  usted  desea  hallar  el  promedio  de  estaturas 
de  todos  los  estudiantes  de  una  universidad  en  particular,  ^seleccionaria  toda  la  mues- 
tra  de  los  miembros  del  equipo  de  baloncesto?  En  el  ejemplo  de  la  temperatura  del 
cuerpo,  quien  piensa  de  manera  logica  cuestionarfa  un  promedio  de  1868  basado  en 
un  millon  de  mediciones,  cuando  las  computadoras  ni  siquiera  se  habian  inventado. 

A  medida  que  el  lector  aprenda  nuevos  terminos  estadisticos,  conceptos  y  tecnicas, 
recuerde  ver  todos  los  problemas  con  ojo  critico  y  verificar  que  la  regia  de  sentido  comun 
se  aplica.  En  todo  el  texto,  le  recordaremos  de  los  problemas  y  riesgos  en  el  uso  o  mal 
uso  de  estadisticas.  Benjamin  Disraeli  dijo  una  vez  que  hay  tres  clases  de  mentiras,  men- 
tiras,  malditas  mentiras  y  estadisticas.  Nuestro  proposito  es  disipar  esta  frase,  para  mos- 
trar  al  estudiante  como  hacer  que  las  estadisticas  funcionen  y  no  le  mientan  a  usted. 

Cuando  continue  por  este  libro,  periodicamente  consulte  este  “manual  de  entrena- 
miento”.  Cada  capitulo  aumentara  su  conocimiento  del  lenguaje  de  estadistica  y  debe, 
en  alguna  forma,  ayudar  al  lector  a  dar  uno  de  los  pasos  aqui  descritos.  Cada  uno  de 
estos  pasos  es  esencial  para  alcanzar  el  objetivo  general  de  la  estadistica  inferential: 
hacer  inferencias  acerca  de  una  poblacion  usando  information  contenida  en  una  muestra 
tomada  de  esa  poblacion. 
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OBJETIVOS  GENERALES 


m 


Descripcion 
de  datos 
por  medio 
de  graficas 


Numerosos  conjuntos  de  mediciones  son  muestras  selec- 
cionadas  de  poblaciones  mas  grandes;  otros  constituyen 
toda  una  poblacion,  como  es  el  caso  de  un  censo  nacio- 
nal.  En  este  capitulo  aprenderemos  que  es  una  variable, 
como  clasificar  variables  en  varios  tipos  y  como  se  gene- 
ran  mediciones  o  datos.  El  lector  aprendera  entonces  a 
usar  graficas  para  describir  conjuntos  de  datos. 

INDICE  DEL  CAPITULO 

Distribuciones  de  datos  y  sus  formas  (1.1,  1.4) 

Graficas  de  puntos  (1 .4) 

Graficas  de  pastel,  de  barras,  de  lineas  (1 .3,  1 .4) 
Variables  cualitativas  y  cuantitativas,  discretas 
y  continuas  (1 .2) 


W)  (Como  esta  su  presion 
sanguines? 

ySu  presion  sangumea  es  normal  o  es  demasiado 
alta  o  demasiado  baja?  El  estudio  practico  que 
aparece  al  final  de  este  capitulo  examina  un  con- 
junto  grande  de  datos  sobre  la  presion  sangumea. 
El  lector  usara  graficas  para  describir  estos  da¬ 
tos  y  comparar  su  presion  sangumea  con  la  de 
otros  de  su  misma  edad  y  genera. 


Histogramas  de  frecuencia  relativa  (1 .5) 


Graficas  de  tallo  y  hoja  (1 .4) 


Datos  univariados  y  bivariados  (1 .1) 


Variables,  unidades  experimentales,  muestras 
y  poblaciones,  datos  (1.1) 


ENTRENADOR  PERSONAL 


£Como  construyo  una  grafica  de  tallo  y  hoja? 
£C6mo  construyo  un  histograma  de  frecuencia 
relativa? 
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8  O  CAPlTULO  1  DESCRIPCIONDE  DATOSPOR  MEDIO  DEGRAFICAS 


E  J  E  M  P  L 


VARIABLES  Y  DATQS 

En  los  capitulos  1  y  2  presentaremos  algunas  tecnicas  basicas  de  estadistica  descriptiva, 
que  es  la  rama  de  la  estadistica  que  se  ocupa  de  describir  conjuntos  de  mediciones,  tanto 
muestras  como  poblaciones.  Una  vez  que  el  lector  haya  recolectado  un  conjunto  de 
mediciones,  ^como  puede  mostrar  este  conjunto  en  una  forma  clara,  entendible  y  facil 
de  leer?  Primero,  debe  tener  aptitud  para  definir  lo  que  se  entiende  por  medicion  o  “datos” 
y  clasificar  los  tipos  de  datos  que  probablemente  se  encuentre  en  la  vida  real.  Empeza- 
mos  por  introducir  algunas  definiciones,  terminos  nuevos  en  el  lenguaje  de  la  estadistica 
que  es  necesario  saber. 


Definicion  Una  variable  es  una  caracterfstica  que  cambia  o  varfa  con  el  tiempo  y/o 
para  diferentes  personas  u  objetos  bajo  consideracion. 


Por  ejemplo,  la  temperatura  corporal  es  una  variable  que  cambia  con  el  tiempo  en  una 
sola  persona;  tambien  varfa  de  una  persona  a  otra.  La  afiliacion  religiosa,  el  origen 
etnico,  el  ingreso,  la  estatura,  edad  y  numero  de  hijos  son  todas  ellas  variables,  es  decir, 
caracteristicas  que  varfan  segun  la  persona  seleccionada. 

En  la  Introduction  definimos  una  unidad  experimental  o  un  elemento  de  la  muestra 
como  el  objeto  en  el  que  se  toma  una  medicion.  Del  mismo  modo,  podrfamos  definir  una 
unidad  experimental  como  el  objeto  en  el  que  se  mide  una  variable.  Cuando  una  variable 
se  mide  en  realidad  en  un  conjunto  de  unidades  experimentales,  resulta  un  conjunto  de 
mediciones  o  de  datos. 


Definicion  Una  unidad  experimental  es  el  individuo  u  objeto  en  el  que  se  mide 
una  variable.  Resulta  una  sola  medicion  o  datos  cuando  una  variable  se  mide  en  realidad 
en  una  unidad  experimental. 


Si  se  genera  una  medicion  para  toda  unidad  experimental  en  toda  la  coleccion,  el  con¬ 
junto  de  datos  resultante  constituye  la  poblacion  de  interes.  Cualquier  conjunto  mas 
pequeno  de  mediciones  es  una  muestra. 


Definicion  Una  poblacion  es  el  conjunto  de  mediciones  de  interes  para  el  investi- 
gador. 


Definicion  Una  muestra  es  un  subconjunto  de  mediciones  seleccionado  de  la 
poblacion  de  interes. 

De  entre  todos  los  alumnos  de  una  gran  universidad  se  selecciona  un  conjunto  de  cinco 
estudiantes  y  las  mediciones  se  introducen  en  una  hoja  de  calculo,  como  la  que  se  mues¬ 
tra  en  la  figura  1.1.  Identifique  los  diversos  elementos  comprendidos  en  la  generation  de 
este  conjunto  de  mediciones. 

Solucion  Hay  diversas  variables  en  este  ejemplo.  La  unidad  experimental  en  la  que 
se  miden  las  variables  es  un  alumno  del  plantel  en  particular,  identificado  en  la  columna 
Cl.  Se  miden  cinco  variables  para  cada  estudiante:  promedio  de  calificaciones  (GPA), 
genero,  ano  en  la  universidad,  curso  de  maestrfa  y  numero  actual  de  unidades  en  las 
que  esta  inscrito.  Cada  una  de  estas  caracteristicas  varfa  de  un  estudiante  a  otro.  Si  con- 
sideramos  las  GPA  de  todos  los  estudiantes  de  esta  universidad  como  la  poblacion  de 
interes,  las  cinco  GPA  de  la  columna  C2  representan  una  muestra  de  esta  poblacion. 
Si  se  hubiera  medido  el  GPA  de  cada  estudiante  de  la  universidad,  hubieramos  generado 
toda  la  poblacion  de  mediciones  para  esta  variable. 
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FIGURA  1  . 1 

Mediciones  de  cinco 
estudiantes 
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English 
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F 
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14 

A 
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< 
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La  segunda  variable  que  se  mide  en  los  estudiantes  es  el  genero,  en  la  columna  C3-T. 
Esta  variable  puede  tomar  solo  dos  valores:  Masc  (M)  o  Fem  (F).  No  es  una  variable 
que  tenga  valor  numerico  y,  por  lo  tanto,  es  un  poco  diferente  del  GPA.  La  poblacion,  si 
pudiera  ser  enumerada,  estarfa  formada  por  un  conjunto  de  letras  M  y  F.  una  para  cada 
estudiante  de  la  universidad.  Analogamente,  las  variables  tercera  y  cuarta,  ano  y  espe- 
cialidad,  generan  datos  no  numericos.  El  ano  tiene  cuatro  categories  (primero,  segundo, 
pasante  y  graduado)  y  la  especialidad  tiene  una  categorfa  para  cada  especialidad  en  el 
plantel.  La  ultima  variable,  el  numero  actual  de  unidades  en  que  esta  inscrito,  es  de  valor 
numerico  y  genera  un  conjunto  de  numeros  en  lugar  de  un  conjunto  de  cualidades  o 
caracteristicas. 

Aun  cuando  hemos  examinado  cada  una  de  las  variables  en  forma  individual,  recuerde 
que  hemos  medido  cada  una  de  estas  cinco  variables  en  una  sola  unidad  experimental: 
el  estudiante.  Por  lo  tanto,  en  este  ejemplo,  una  “medicion”  en  realidad  esta  formada  por 
cinco  observaciones,  una  para  cada  una  de  las  cinco  variables  medidas.  Por  ejemplo,  la 
medicion  tomada  en  el  estudiante  2  produce  esta  observation: 

(2.3,  F,  So,  Matematicas,  15) 


Se  puede  ver  que  hay  una  diferencia  entre  una  sola  variable  medida  en  una  sola  uni¬ 
dad  experimental  y  multiples  variables  medidas  en  una  unidad  experimental  como  en  el 
ejemplo  1.1. 


Definicion  Resultan  datos  univariados  cuando  se  mide  una  sola  variable  en  una 
sola  unidad  experimental. 


Definicion  Resultan  datos  bivariados  cuando  se  miden  dos  variables  en  una  sola 
unidad  experimental.  Resultan  datos  multivariados  cuando  se  miden  mas  de  dos  varia¬ 
bles. 


Si  se  miden  las  temperaturas  corporales  de  148  personas,  los  datos  resultantes  son  univa¬ 
riados.  En  el  ejemplo  1.1,  cinco  variables  se  midieron  en  cada  estudiante,  lo  que  resulto 
en  datos  multivariados. 
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10  O  CAPITULO  1  DESCRIPCION  DE  DATOS  POR  MEDIO  DE  GRAFICAS 


TIPQS  DE  VARIABLES 

Se  pueden  clasificar  variables  en  una  de  dos  categorias:  cualitativas  y  cuantitativas. 


Definicion  Las  variables  cualitativas  miden  una  cualidad  o  caracterfstica  en  cada 
unidad  experimental.  Las  variables  cuantitativas  miden  una  cantidad  numerica  en 
cada  unidad  experimental. 


CONSEJO 

Cualitativo  <=>  "calidad" 
o  caracteristica 
Cuantitativo  <=>  "cantidad" 
o  numero 


Las  variables  cualitativas  producen  datos  que  se  pueden  clasificar  de  acuerdo  a  simi¬ 
litudes  o  diferencias  en  clase;  por  lo  tanto,  con  frecuencia  se  denominan  datos  catego- 
ricos.  Las  variables  como  genero,  ano  y  especialidad  en  el  ejemplo  1.1  son  variables 
cualitativas  que  producen  datos  categoricos.  He  aquf  algunos  otros  ejemplos: 

•  Afiliacion  political  republicano,  democrata,  independiente 

•  Clasificacion  de  gusto:  excelente,  bueno,  regular,  malo 

•  Color  de  un  dulce  M&M’S®:  cafe,  amarillo,  rojo,  anaranjado,  verde,  azul 

Las  variables  cuantitativas,  con  frecuencia  representadas  por  la  letra  x,  producen 
datos  numericos,  por  ejemplo  estos: 

•  x  =  tasa  preferencial  de  interes 

•  x  =  numero  de  pasajeros  en  un  vuelo  de  Los  Angeles  a  Nueva  York 

•  x  =  peso  de  un  paquete  listo  para  ser  enviado 

•  x  =  volumen  de  jugo  de  naranja  en  un  vaso 

Observe  que  hay  una  diferencia  en  los  tipos  de  valores  numericos  que  pueden  tomar 
estas  variables  cuantitativas.  El  numero  de  pasajeros,  por  ejemplo,  puede  tomar  solo  los 
valores  x  =  0,  1,  2,  mientras  que  el  peso  de  un  paquete  puede  tomar  cualquier  valor 
mayor  a  cero,  o  sea  0  <  x  <  °°.  Para  describir  esta  diferencia,  definimos  dos  tipos  de 
variables  cuantitativas:  discretas  y  continuas. 


Definicion  Una  variable  discreta  puede  tomar  solo  un  numero  finito  o  contable  de 
valores.  Una  variable  continua  puede  tomar  infinitamente  muchos  valores  correspon- 
dientes  a  los  puntos  en  un  intervalo  de  recta. 


Discreta  <=>  "factible  de 
poner  en  lista" 

Continua  <=>  "no  factible  de 
poner  en  lista" 


El  nombre  de  discreta  se  refiere  a  las  brechas  discretas  entre  los  posibles  valores 
que  la  variable  puede  tomar.  Variables  como  el  numero  de  miembros  de  una  familia, 
el  numero  de  ventas  de  autos  nuevos  y  el  numero  de  llantas  defectuosas  devueltas  para 
cambio  son  todos  ellos  ejemplos  de  variables  discretas.  Por  el  contrario,  variables  como 
la  estatura,  peso,  tiempo,  distancia  y  volumen  son  continuas  porque  pueden  tomar  valo¬ 
res  en  cualquier  punto  a  lo  largo  de  un  intervalo  de  recta.  Para  cualesquier  dos  valores 
que  se  escojan,  un  tercer  valor  siempre  puede  hallarse  entre  ellos. 

Identifique  cada  una  de  las  siguientes  variables  como  cualitativas  o  cuantitativas: 

1.  El  uso  mas  frecuente  de  su  horno  de  microondas  (recalentar,  descongelar,  calen- 
tar,  otros) 

2.  El  numero  de  consumidores  que  se  niegan  a  contestar  una  encuesta  por  telefono 

3.  La  puerta  escogida  por  un  raton  en  un  experimento  de  laberinto  (A,  B  o  C) 

4.  El  tiempo  ganador  para  un  caballo  que  corre  en  el  Derby  de  Kentucky 

5.  El  numero  de  ninos  en  un  grupo  de  quinto  grado  que  leen  al  nivel  de  ese  grado  o 
mejor 
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CONSEJO 


Es  frecuente  que  las  variables 
discretas  comprendan  el 
"numero'’  de  artlculos  de  un 
conjunto. 


Solucion  Las  variables  1  y  3  son  cualitativas  porque  solo  una  cualidad  o  caracte- 
rfstica  se  mide  para  cada  individuo.  Las  categories  para  estas  dos  variables  se  muestran 
entre  parentesis.  Las  otras  tres  variables  son  cuantitativas.  La  variable  2,  el  numero  de 
consumidores,  es  una  variable  discreta  que  puede  tomar  cualquiera  de  los  valores  x  = 
0,  1,2,  ...,  con  un  valor  maximo  que  depende  del  numero  de  consumidores  llamados. 
Del  mismo  modo.  la  variable  5,  el  numero  de  ninos  que  leen  al  nivel  de  ese  grado,  o 
mejor,  pueden  tomar  cualquiera  de  los  valores  x  =  0, 1,  2,  . . con  un  valor  maximo  que 
depende  del  numero  de  ninos  que  haya  en  el  grupo.  La  variable  4,  el  tiempo  ganador  para 
un  caballo  del  Derby  de  Kentucky,  es  la  unica  variable  continua  de  la  lista.  El  tiempo 
ganador,  si  pudiera  medirse  con  suficiente  precision,  podrfa  ser  121  segundos,  121.5 
segundos,  121.25  segundos  o  cualesquier  valores  entre  dos  tiempos  cualesquiera  que 
hemos  puesto  en  lista. 


La  figura  1.2  describe  los  tipos  de  datos  que  hemos  definido.  ^Por  que  debe  el  lector 
preocuparse  por  diferentes  clases  de  variables  y  los  datos  que  generan?  La  razon  es  que 
los  metodos  empleados  para  describir  conjuntos  de  datos  dependen  del  tipo  de  datos 
que  haya  recolectado.  Para  cada  uno  de  los  conjuntos  de  datos  recolectados,  la  clave 
sera  determinar  que  tipo  de  datos  tiene  y  jcomo  puede  presentarlos  en  forma  mas  clara 
y  entendible  a  su  audiencia! 


grAficas  para  datos  categoricos 


Una  vez  recolectados  los  datos,  estos  pueden  consolidarse  y  resumirse  para  mostrar  la 
siguiente  information: 


•  ^Que  valores  de  la  variable  han  sido  medidos? 

•  iCon  que  frecuencia  se  presenta  cada  uno  de  los  valores? 


Para  este  fin,  se  puede  construir  una  tabla  estadistica  que  se  puede  usar  para  mostrar 
los  datos  graficamente  como  una  distribution  de  datos.  El  tipo  de  grafica  que  se  escoja 
depende  del  tipo  de  variable  que  se  haya  medido. 

Cuando  la  variable  de  interes  es  cualitativa,  la  tabla  estadistica  es  una  lista  de  las  cate¬ 
gories  siendo  consideradas  junto  con  una  medida  de  la  frecuencia  con  que  se  presenta 
cada  valor.  Se  puede  medir  “la  frecuencia”  en  tres  formas  diferentes: 

•  La  frecuencia  o  numero  de  mediciones  en  cada  categorfa 

•  La  frecuencia  relativa  o  proportion  de  mediciones  en  cada  categorfa 

•  El  porcentaje  de  mediciones  en  cada  categorfa 
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Tres  pasos  para  una 
distribucion  de  datos: 

(1)  datos  sin  eiaborar  => 

(2)  tabla  estadistica  => 
(3}  grafica 


E  J  E  M  P  L  O 


TABLA  1.1 


Por  ejemplo,  si  con  n  representamos  el  numcro  total  de  mediciones  en  el  conjunto,  se 
puede  hallar  la  frecuencia  relativa  y  porcentaje  usando  estas  relaciones: 


Frecuencia  relativa  = 


Frecuencia 


Porcentaje  =  100  X  Frecuencia  relativa 


Se  encontrara  que  la  suma  de  las  frecuencias  es  siempre  n,  la  suma  de  las  frecuencias 
relativas  es  1  y  la  suma  de  los  porcentajes  es  100%. 

Las  categories  para  una  variable  cualitativa  deben  escogerse  de  modo  que 

•  una  medicion  pertenecera  a  una  categorfa  y  solo  a  una 

•  cada  medicion  tiene  una  categorfa  a  la  que  se  puede  asignar 


Por  ejemplo,  si  se  pueden  clasificar  productos  carnicos  de  acuerdo  con  el  tipo  de  carne 
utilizada,  se  pueden  usar  estas  categorfas:  carne  de  res,  polio,  marisco,  carne  de  puerco, 
pavo,  otra.  Para  clasificar  rangos  de  la  facultad  de  una  escuela,  se  pueden  usar  estas 
categorfas:  profesor,  profesor  adjunto,  profesor  auxiliar,  instructor,  conferenciante,  otro. 
La  categorfa  “otro”  esta  incluida  en  ambos  casos  para  tomar  en  cuenta  la  posibilidad  de 
que  una  medicion  no  se  pueda  asignar  a  una  de  las  categorfas  anteriores. 

Una  vez  que  a  las  mediciones  se  les  hayan  dado  categorfas  y  se  resumieron  en  una 
tabla  estadistica,  se  puede  usar  ya  sea  una  grafica  de  pastel  o  una  grafica  de  barras  para 
mostrar  la  distribucion  de  los  datos.  Una  grafica  de  pastel  es  la  conocida  grafica  circu¬ 
lar  que  muestra  la  forma  en  que  estan  distribuidas  las  medidas  entre  las  categorfas.  Una 
grafica  de  barras  muestra  la  misma  distribucion  de  medidas  en  categorfas,  con  la  altura 
de  la  barra  midiendo  la  frecuencia  con  la  que  se  observa  una  categorfa  en  particular. 


En  una  encuesta  respecto  a  la  educacion  publica,  a  400  administradores  de  escuelas  se 
les  pidio  calificaran  la  calidad  de  la  educacion  en  Estados  Unidos.  Sus  respuestas  estan 
resumidas  en  la  tabla  1.1.  Construya  una  grafica  de  pastel  y  una  de  barras  a  partir  de  este 
conjunto  de  datos. 


Solucion  Para  construir  una  grafica  de  pastel,  asigne  un  sector  de  cfrculo  a  cada 
categorfa.  El  angulo  de  cada  sector  debe  ser  proporcional  a  la  magnitud  de  las  medicio¬ 
nes  (o  frecuencia  relativa )  en  esa  categorfa.  Como  un  cfrculo  contiene  360°,  se  puede 
usar  esta  ecuacion  para  hallar  el  angulo: 

Angulo  =  Frecuencia  relativa  X  360° 

Calificacion  de  la  educacion  en  Estados  Unidos 
hecha  por  400  educadores 

Calificacion  Frecuencia 

A  35 

B  260 

C  93 

D_ 12 

Total  400 


CONSEJO 


Las  proporciones  suman  1; 
los  porcentajes,  100:  los 
angulos  de  sector,  360°. 


La  tabla  1.2  muestra  las  calificaciones  junto  con  las  frecuencias,  frecuencias  relativas, 
porcentajes  y  angulos  de  sector  necesarios  para  construir  la  grafica  de  pastel.  La  figura 
1.3  muestra  la  grafica  de  pastel  construida  a  partir  de  los  valores  de  la  tabla.  Mientras 
que  las  graficas  de  pastel  usan  porcentajes  para  determinar  los  tamanos  relativos  de 
las  “rebanadas  de  pastel”,  las  de  barras  por  lo  general  grafican  frecuencia  contra  las  cate¬ 
gorfas.  Una  grafica  de  barras  para  estos  datos  se  muestra  en  la  figura  1.4. 
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TABLA  1.2  Calculos  para  la  grafica  de  pastel  del  ejemplo  1 .3 


Calificacion 

Frecuencia 

Frecuencia  relativa 

Porcentaje 

Angulo 

A 

35 

35/400  =  .09 

9% 

.09  X  360  =  32.4s 

B 

260 

260/400  =  .65 

65% 

234.0s 

C 

93 

93/400  =  .23 

23% 

82.8s 

D 

12 

12/400  =  .03 

3% 

10.8s 

Total 

400 

1.00 

100% 

360s 

El  impacto  visual  de  estas  dos  graficas  es  un  poco  diferente.  La  grafica  de  pastel  se  usa 
para  mostrar  las  relaciones  de  las  partes  con  respecto  al  todo;  la  grafica  de  barras  se 
usa  para  destacar  la  cantidad  real  o  frecuencia  para  cada  categorfa.  Como  las  categories 
en  este  ejemplo  son  “calificaciones”  ordenadas  (A,  B,  C,  D),  no  desearfamos  reacomo- 
dar  las  barras  de  la  grafica  para  cambiar  su  forma.  En  una  grafica  de  pastel,  el  orden  de 
presentacion  es  irrelevante. 


Pirn  ip  a  i  n 


PimiRA  i  a. 


Una  bolsa  de  tamano  botana  de  dulces  de  cacahuate  M&M’S  contiene  21  dulces  con  los 
colores  que  se  indican  en  la  tabla  1.3.  La  variable  “color”  es  cucilitativa,  por  lo  que  la 
tabla  1 .4  pone  en  lista  las  seis  categories  junto  con  un  total  del  numero  de  dulces  de  cada 
color.  Las  ultimas  tres  columnas  de  la  tabla  1.4  dan  las  tres  diferentes  medidas  de  con 
que  frecuencia  se  presenta  cada  categorfa.  Como  las  categories  son  colores  y  no  tienen 
un  orden  particular,  se  pueden  construir  graficas  de  barras  con  muchas  formas  diferen¬ 
tes  con  solo  reordenar  las  barras.  Para  enfatizar  que  el  cafe  es  el  color  mas  frecuente, 
seguido  por  el  azul,  verde  y  anaranjado,  ordenamos  las  barras  de  mayor  a  menor  y  gene- 
ramos  la  grafica  de  barras  usando  el  MINITAB  en  la  figura  1 .5.  Una  grafica  de  barras  en  la 
que  las  barras  estan  ordenadas  de  mayor  a  menor  se  denomina  grafica  de  Pareto. 
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TABLA  1.3  Datos  sin  elaborar:  colores  de  21  dulces 


Cafe 

Verde 

Cafe 

Azul 

Rojo 

Rojo 

Verde 

Cafe 

Amarillo 

Anaranjado 

Verde 

Azul 

Cafe 

Azul 

Azul 

Cafe 

Anaranjado 

Azul 

Cafe 

Anaranjado 

Amarillo 


TABLA  1  Tabla  estadfstica:  datos  de  M&M'S  para  el  ejemplo  1.4 


Categoria 

Total 

Frecuencia 

Frecuencia  relativa 

Porcentaje 

Cafe 

Ml 

6 

6/21 

28% 

Verde 

III 

3 

3/21 

14 

Anaranjado 

III 

3 

3/21 

14 

Amarillo 

II 

2 

2/21 

10 

Rojo 

II 

2 

2/21 

10 

Azul 

m 

5 

5/21 

24 

Total 

21 

1 

100% 

FIGURA  1  .5 

Grafica  de  barras  MINITAB 
para  el  ejemplo  1.4 
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EJERCICIOS 


PARA  ENTENDER  LOS  CONCEPTOS 

1.1  Unidades  experimentales  Identifique 
las  unidades  experimentales  en  los  que  se  miden  las 
variables  siguientes: 

a.  Genero  de  un  estudiante 

b.  Numero  de  errores  en  un  examen  de  medio  semestre 

c.  Edad  de  un  paciente  con  cancer 

d.  Numero  de  flores  en  una  planta  de  azalea 

e.  Color  de  un  auto  que  entra  a  un  estacionamiento 


1.2  iCualitativa  o  cuantitativa?  Identifique  cada  una 
de  las  variables  como  cuantitativa  o  cualitativa: 

a.  Tiempo  para  ensamblar  un  rompecabezas  sencillo 

b.  Numero  de  estudiantes  en  un  salon  de  clases  de  primer 
ano 

c.  Calificacion  de  un  politico  recien  electo  (excelente, 
bueno,  regular,  malo) 

d.  Estado  en  que  vive  una  persona 
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1.3  /Discreta  o  continua?  Identifique  las  siguientes 
variables  cuantitativas  como  discretas  o  continuas: 

a.  Poblacion  en  una  region  particular  de  un  pais 

b.  Peso  de  periodicos  recuperados  para  reciclar  en  un 
solo  dfa 

c.  Tiempo  para  completar  un  examen  de  sociologfa 

d.  Numero  de  consumidores  en  una  encuesta  de  1000 
que  consideran  importante  aplicar  leyenda  nutrimental 
en  productos  alimenticios 

1.4  /Discreta  o  continua?  Identifique  cada  una  de  las 
variables  cuantitativas  como  discretas  o  continuas. 

a.  Numero  de  accidentes  en  botes  en  un  tramo  de  50 
millas  del  no  Colorado 

b.  Tiempo  para  completar  un  cuestionario 

c.  Costo  de  una  lechuga 

d.  Numero  de  hermanos  y  hermanas  que  tenga  el  lector 

e.  Rendimiento  en  kilogramos  de  trigo  para  un  terreno  de 
1  hectarea  de  un  trigal 

1.5  Estacionamiento  en  un  plantel  Se  seleccionan 
seis  vehfculos,  de  entre  los  que  tienen  permiso  para 
estacionarse,  y  se  registran  los  datos  siguientes: 

Distancia  de 

viaje  en  una  Antiguedad 
direccion  del  vehfculo 


Vehlculo 

Tipo 

Marca 

/Colectivo? 

(millas) 

(anos) 

1 

Auto 

Honda 

No 

23.6 

6 

2 

Auto 

Toyota 

No 

17.2 

3 

3 

Camion 

Toyota 

No 

10.1 

4 

4 

Van 

Dodge 

Si 

31.7 

2 

5 

Moto- 

cicleta 

Harley- 

Davidson 

No 

25.5 

1 

6 

Auto 

Chevrolet 

No 

5.4 

9 

a.  /Cuales  son  las  unidades  experimentales? 

b.  /Cuales  son  las  variables  que  se  miden?  /Que  tipos  de 
variables  son? 

c.  /Estos  datos  son  univariados,  bivariados  o  multivariados? 

1.6  Presidentes  de  Estados  Unidos  Unconjunto 
de  datos  contiene  las  edades  al  fallecimiento  de  cada 
uno  de  los  anteriores  38  presidentes  de  Estados  Unidos 
ah  ora  desaparecidos. 

a.  /Este  conjunto  de  mediciones  es  una  poblacion  o  una 
muestra? 

b.  /Cual  es  la  variable  que  se  mide? 

c.  /  La  variable  del  inciso  b)  es  cuantitativa  o  cualitativa? 

1 .7  Actitudes  del  electorado  Usted  es  candidate  a  la 
legislature  de  su  estado  y  desea  hacer  una  encuesta  de  las 
actitudes  del  electorado,  respecto  a  las  probabilidades  que 
tenga  usted  para  ganar.  Identifique  la  poblacion  que  es  de 
interes  para  usted  y  de  la  que  le  gustarfa  seleccionar  una 
muestra.  /  En  que  forma  esta  poblacion  depende  del  tiempo? 


1.8  Tiempos  de  supervivencia  al  cancer  Un 

investigador  medico  desea  estimar  el  tiempo  de 
supervivencia  de  un  paciente,  despues  del  inicio 
de  un  tipo  particular  de  cancer  y  despues  de  un  regimen 
particular  de  radioterapia. 

a.  /Cual  es  la  variable  de  interes  para  el  investigador 
medico? 

b.  / La  variable  del  inciso  a)  es  cualitativa,  cuantitativa, 
discreta  o  cuantitativa  continua? 

c.  Identifique  la  poblacion  de  interes  para  el  investigador 
medico. 

d.  Describa  la  forma  en  que  el  investigador  podrfa 
seleccionar  una  muestra  de  entre  la  poblacion. 

e.  /Que  problemas  podrfan  surgir  al  muestrear  desde  esta 
poblacion? 

1.9  Nuevos  metodos  de  ensenanza  Un  investigador 
educacional  desea  evaluar  la  efectividad  de  un  nuevo 
metodo  de  ensenanza  de  lectura  a  estudiantes  sordos.  El 
logro  al  final  de  un  periodo  de  ensenanza  es  medido  por 
la  calificacion  de  un  estudiante  en  un  examen  de  lectura. 

a.  /Cual  es  la  variable  a  medir?  /Que  tipo  de  variable  es? 

b.  /Cual  es  la  unidad  experimental? 

c.  Identifique  la  poblacion  de  interes  para  el 
experimentador. 

TECNICAS  BASICAS 

1.10  Cincuenta  personas  se  agrupan  en  cuatro  categories, 
A,  B,  C  y  D,  y  el  numero  de  personas  que  caen  en  cada 
categorfa  se  muestra  en  la  tabla: 


Categorla 

Frecuencia 

A 

11 

B 

14 

C 

20 

D 

5 

a.  /Cual  es  la  unidad  experimental? 

b.  /Cual  es  la  variable  que  se  mide?  /Es  cualitativa  o 
cuantitativa? 

c.  Construya  una  grafica  de  pastel  para  describir  los 
datos. 

d.  Construya  una  grafica  de  barras  para  describir  los 
datos. 

e.  /La  forma  de  la  grafica  de  barras  del  inciso  d) 
cambia,  dependiendo  del  orden  de  presentacion 
de  las  cuatro  categorfas?  /Es  importante  el 
orden  de  presentacion? 

f.  /Que  proportion  de  las  personas  esta  en  la  categorfa 
B,  CoD? 

g.  /Que  porcentaje  de  las  personas  no  esta  en  la 
categorfa  B? 


www.FreeLibros.me 


16  O  CAPITULO  1  DESCRIPCION  DE  DATOS  POR  MEDIO  DE  GRAFICAS 


1.11  Jeans  Un  fabricante  de  jeans  (pantalones 
vaqueros)  tiene  plantas  en  California,  Arizona  y  Texas. 
Un  grupo  de  25  pares  de  jeans  se  selecciona  al  azar  de 
entre  la  base  de  datos  computarizada,  registrandose  el 
estado  en  el  que  se  produce: 


CA 

AZ 

AZ 

TX 

CA 

CA 

CA 

TX 

TX 

TX 

AZ 

AZ 

CA 

AZ 

TX 

CA 

AZ 

TX 

TX 

TX 

CA 

AZ 

AZ 

CA 

CA 

a.  (',Cua I  es  la  unidad  experimental? 

b.  ^Cual  es  la  variable  que  se  mide?  ^Es  cualitativa  o 
cuantitativa? 

c.  Construya  una  grafica  de  pastel  para  describir  los 
datos. 

d.  Construya  una  grafica  de  barras  para  describir  los 
datos. 

e.  ^Que  proportion  de  los  jeans  se  hace  en  Texas? 

f.  7,  Cual  estado  produjo  mas  jeans  del  grupo? 

g.  Si  se  desea  averiguar  si  las  tres  plantas  produjeron 
iguales  numeros  de  jeans,  o  si  una  produjo  mas  jeans 
que  las  otras,  ^como  se  pueden  usar  las  graficas  de  las 
partes  c  y  d  para  ayudar?  ^Que  conclusiones  puede  el 
lector  sacar  de  estos  datos? 

APLICACIONES 

1.12  leccion  2008  Durante  la  primavera  de  2006, 
los  medios  de  comunicacion  ya  estaban  realizando 
encuestas  de  opiniones  que  rastreaban  las  fortunas  de 
los  principales  candidatos  que  esperaban  ser  presidentes 
en  Estados  Unidos.  Una  de  estas  encuestas,  dirigida  por 
Financial  Dynamics,  mostro  los  siguientes  resultados: 

“Pensando  por  adelantado  en  la  siguiente  eleccion  presiden- 
cial,  si  la  eleccion  de  2008  se  realizara  hoy  y  los  candidatos 
fueran  democratas  [vea  abajo]  y  republicanos  [vea  abajo], 
7por  quien  votarfa? 


John 

McCain  (R) 

% 

46 

Hillary 
Clinton  (D) 

% 

42 

Inseguro 

% 

13 

John 

McCain 

Al  Gore 

Inseguro 

% 

% 

% 

51 

33 

15 

Rudy 

Giuliani 

Hillary 

Clinton 

Inseguro 

% 

% 

% 

49 

40 

12 

Rudy 

Giuliani 

Al  Gore 

Inseguro 

% 

% 

% 

50 

37 

13 

Fuente:  www.pollingreport.com 


Los  resultados  estuvieron  basados  en  una  muestra  tomada 
en  los  dfas  16,  17  y  18  de  mayo  de  2006,  de  900  votantes 
registrados  en  todo  el  pais. 

a.  Si  los  entrevistadores  estuvieran  planeando  usar  estos 
resultados  para  pronosticar  el  resultado  de  la  eleccion 
presidencial  de  2008,  describa  la  poblacion  de  interes 
para  ellos. 

b.  Describa  la  poblacion  real  de  la  cual  se  saco  la 
muestra. 

c.  Algunos  entrevistadores  prefieren  seleccionar 
una  muestra  de  “probables”  votantes.  ^Cual  es  la 
diferencia  entre  “votantes  registrados”  y  “probables 
votantes”?  qPor  que  es  esto  importante? 

d.  La  muestra  seleccionada  por  los  entrevistadores,  ^es 
representativa  de  la  poblacion  descrita  en  el  inciso  a)? 
Explique. 

1.13  ^Desea  ser  presidente?  ^Le  gustarfa  ser 

presidente  de  Estados  Unidos?  Aun  cuando  muchos 

adolescentes  piensan  que  podrfan  llegar  a  ser  presidente, 

muchos  no  desean  el  trabajo.  En  una  encuesta  de  opinion 

realizada  por  ABC  News,  casi  80%  de  los  adolescentes 
•  •  2 

no  estaban  interesados  en  el  trabajo.  Cuando  se  les 
preguntaba:  “(  Cual  es  la  principal  razon  por  la  que  no 
querrfa  ser  presidente?”  dieron  estas  respuestas: 


Otros  planes  de  carrera/no  le  interesa  40% 

Demasiada  presion  20% 

Demasiado  trabajo  1 5% 

No  serla  bueno  para  ello  14% 

Demasiadas  discusiones  5% 


a.  (.Estan  consideradas  todas  las  razones  en  esta  tabla? 

b.  (,Usana  usted  una  grafica  de  pastel  o  una  de  barras 
para  describir  graficamente  los  datos?  ^Por  que? 

c.  Trace  la  grafica  escogida  en  el  inciso  b). 

d.  Si  usted  fuera  a  conducir  la  encuesta  de  opiniones, 
((que  otros  tipos  de  preguntas  deseana  investigar? 

1.14  Distribuciones  de  carrera  en  las  fuerzas 
armadas  Las  cuatro  ramas  de  las  fuerzas  armadas  en 
Estados  Unidos  son  muy  diferentes  en  su  formacion 
con  respecto  a  las  distribuciones  de  genero,  raza  y 
edad.  La  tabla  siguiente  muestra  el  desglose  racial  de 
los  miembros  del  Ejercito  y  la  Fuerza  Aerea  de  Estados 
Unidos.3 

Ejercito  Fuerza  Aerea 


Blanco 

58.4% 

75.5% 

Negro 

26.3% 

16.2% 

Latino 

8.9% 

5.0% 

Otro 

6.4% 

3.3% 

Fuente:  revista  Time 


a.  Defina  la  variable  que  se  ha  medido  en  esta  tabla. 
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b.  (',La  variable  es  cuantitativa  o  cualitativa? 

c.  (',Que  representan  los  numeros? 

d.  Construya  una  grafica  de  pastel  para  describir  el 
desglose  racial  en  el  Ejercito  de  Estados  Unidos. 

e.  Construya  una  grafica  de  barras  para  describir  el 
desglose  de  razas  en  la  Fuerza  Aerea  de  Estados 
Unidos. 

f.  ^Que  porcentaje  de  los  miembros  del  Ejercito  de 
Estados  Unidos  son  minorfas,  es  decir,  no  blancos? 
(:Cual  es  este  porcentaje  en  la  Fuerza  Aerea  de  Estados 
Unidos? 

1.15  De  regreso  al  trabajo  ^Cuanto  tarda  usted 

en  ajustarse  a  su  rutina  normal  de  trabajo  despues  de 


regresar  de  vacaciones?  A  continuacion  se  muestra  una 
grafica  de  barras  con  datos  de  la  seccion  Instantaneas  de 
USA  Today  4 

a.  (',Estan  consideradas  todas  las  opiniones  de  la  tabla? 
Agregue  otra  categorfa  si  es  necesario. 

b.  (',La  grafica  de  barras  esta  trazada  con  precision?  Esto 
es,  ^estan  las  tres  barras  en  la  proporcion  correcta 
entre  sf? 

c.  Use  una  grafica  de  pastel  para  describir  las  opiniones. 
(,Cual  grafica  es  mas  interesante  para  verla? 


grAficas  para  datos 

CUANTITATIVOS 

Las  variables  cuantitativas  miden  una  cantidad  en  cada  unidad  experimental.  Si  la  varia¬ 
ble  puede  tomar  solo  un  numero  finito  o  contable  de  valores,  es  una  variable  discreta. 
Una  variable  que  puede  tomar  un  numero  infinito  de  valores  correspondientes  a  puntos 
en  un  intervalo  de  recta  se  llama  continua. 


Graficas  de  pastel  y  graficas  de  barras 

A  veces  la  informacion  se  recolecta  para  una  variable  cuantitativa  medida  en  segmentos 
diferentes  de  la  poblacion,  o  para  diferentes  categories  de  clasificacion.  Por  ejemplo,  se 
podrfa  medir  el  promedio  de  ingresos  de  personas  de  diferentes  grupos  de  edad,  generos 
diferentes,  o  que  viven  en  zonas  geograficas  diferentes  del  pats.  En  tales  casos,  se  pueden 
usar  graficas  de  pastel  o  graficas  de  barras  para  describir  los  datos,  usando  la  cantidad 
medida  en  cada  categorfa  en  lugar  de  la  frecuencia  con  que  se  presenta  cada  una  de  las 
categories.  La  grafica  de  pastel  muestra  la  forma  en  que  esta  distribuida  la  cantidad 
total  entre  las  categories  y  la  grafica  de  barras  usa  la  altura  de  la  barra  para  mostrar  la 
cantidad  de  una  categorfa  en  particular. 
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La  cantidad  de  dinero  gastada  en  el  ano  fiscal  2005,  por  el  Departamento  de  Defensa  de 
Estados  Unidos  en  varias  categorfas,  se  muestra  en  la  tabla  1.5. 5  Construya  una  grafica 
de  pastel  y  una  grafica  de  barras  para  describir  los  datos.  Compare  las  dos  formas  de 
presentation. 


TABLA  1.5  Gastos  por  categorfa 


Categoria  Cantidad  (miles  de  millones  de  dolares) 


Personal  militar 

$127.5 

Operacion  y  mantenimiento 

188.1 

Adquisiciones 

82.3 

Investigacion  y  desarrollo 

65.7 

Construccion  militar 

5.3 

Otra 

5.5 

Total 

$474.4 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 


Solucion  Dos  variables  estan  siendo  medidas:  la  categorfa  de  gasto  ( cualitativa ) 
y  la  cantidad  del  gasto  ( cuantitativa ).  La  grafica  de  barras  de  la  figura  1.6  muestra  las 
categorfas  en  el  eje  horizontal  y  las  cantidades  en  el  eje  vertical.  Para  la  grafica  de  pastel 


de  la  figura  1.7,  cada  “rebanada  del  pastel”  representa  la  proportion  de  los  gastos  totales 
($474.4  miles  de  millones  de  dolares)  correspondientes  a  su  categorfa  en  particular.  Por 
ejemplo,  para  la  categoria  de  investigation  y  desarrollo,  el  angulo  del  sector  es 


65.7 

474.4 


X  360°  =  49.9° 


www.FreeLibros.me 


1 .4  grAficas  para  datos  cuantitativos  o  19 


Ambas  graficas  muestran  que  las  cantidades  mas  grandes  de  dinero  se  gastaron  en  per¬ 
sonal  y  operaciones.  Como  no  hay  un  orden  inherente  a  las  categories,  hay  libertad  para 
reacomodar  las  barras  o  sectores  de  las  graficas  en  cualquier  forma  deseada.  La  for¬ 
ma  de  la  grafica  de  barras  no  tiene  nada  que  ver  con  su  interpretacion. 


Graficas  de  Ifneas 

Cuando  una  variable  cuantitativa  se  registra  en  el  tiempo  a  intervalos  igualmente  espa- 
ciados  (por  ejemplo  diario,  semanal,  mensual,  trimestral  o  anual),  el  conjunto  de  datos 
forma  una  serie  de  tiempo.  Los  datos  de  una  serie  de  tiempo  se  presentan  con  mas  efec- 
tividad  en  una  grafica  de  lineas  con  el  tiempo  como  eje  horizontal.  La  idea  es  tratar  de 
distinguir  un  patron  o  tendencia  que  sea  probable  de  continuar  en  el  future  y  luego  usar 
ese  patron  para  hacer  predicciones  precisas  para  el  futuro  inmediato. 

En  el  ano  2025,  el  mayor  de  los  “hijos  de  la  explosion  demografica”  (nacido  en  1946) 
tendra  79  anos,  y  el  mayor  de  los  de  la  “Generacion  X”  (nacido  en  1965)  estara  a  dos 
anos  de  ser  elegible  para  el  Seguro  Social.  ^Como  afectara  esto  a  las  tendencias  del 
consumidor  en  los  siguientes  15  anos?  ^ Habra  suficientes  fondos  para  los  “hijos  de  la 
explosion  demografica”  para  recolectar  prestaciones  del  Seguro  Social?  La  Oficina  de 
Censos  de  Estados  Unidos  da  proyecciones  para  la  parte  de  la  poblacion  norteameri- 
cana  que  tendra  85  anos  y  mas  en  los  proximos  anos,  como  se  muestra  a  continuation.5 
Construya  una  grafica  de  Ifneas  para  ilustrar  los  datos.  ^Cual  es  el  efecto  de  prolongar 
y  contraer  el  eje  vertical  de  la  grafica  de  lfnea? 


TABLA  1.6  Proyecciones  de  crecimiento  de  poblacion 


Ano 

2010 

2020 

2030 

2040 

2050 

85  o  mas  (millones) 

B.1 

7.3 

9.6 

15.4 

20.9 

CONSEJO 


Tenga  cuidado  de  prolongar 
o  contraer  ejes  cuando  vea 
una  grafica. 


Solucion  La  variable  cuantitativa  “85  y  mas”  se  mide  en  cinco  intervalos,  creando 
asf  una  serie  de  tiempo  que  se  puede  graficar  con  una  grafica  de  lfnea.  Los  intervalos  es- 
tan  marcados  en  el  eje  horizontal  y  las  proyecciones  en  el  eje  vertical.  Los  puntos  de 
datos  se  enlazan  luego  por  medio  de  segmentos  de  lfnea  para  formar  las  graficas  de  lfnea 
de  la  figura  1.8.  Observe  la  marcada  diferencia  en  las  escalas  verticales  de  las  dos  grafi¬ 
cas.  Contraer  la  escala  en  el  eje  vertical  hace  que  grandes  cambios  aparezcan  pequenos 
y  viceversa.  Para  evitar  conclusiones  erroneas,  se  deben  ver  con  cuidado  las  escalas  de 
los  ejes  vertical  y  horizontal.  No  obstante,  de  ambas  graficas  se  obtiene  una  imagen  clara 
del  numero  constantemente  creciente  de  quienes  tengan  85  anos  o  mas  en  los  primeros 
anos  del  nuevo  milenio. 
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Graficas  de  puntos 

Muchos  conjuntos  de  datos  cuantitativos  estan  formados  de  numeros  que  no  se  pueden 
separar  facilmente  en  categories  o  intervalos.  Entonces  se  hace  necesaria  una  forma 
diferente  de  graficar  este  tipo  de  datos. 

La  grafica  mas  sencilla  para  datos  cuantitativos  es  la  grafica  de  puntos.  Para  un 
conjunto  pequeno  de  mediciones,  por  ejemplo  el  conjunto  2,  6,  9,  3,  7,  6,  se  puede 
simplemente  graficar  las  mediciones  como  puntos  en  un  eje  horizontal.  Esta  grafica  de 
puntos,  generada  por  MINITAB,  se  muestra  en  la  figura  1.9a).  Para  un  conjunto  gran¬ 
de  de  datos,  como  el  de  la  figura  1 .9b),  la  grafica  de  puntos  puede  ser  nada  informativa 
y  tediosa  para  interpretarse. 


FIGURA  1  .9 

Graficas  de  puntos  para 
conjuntos  pequenos  y 
grandes  de  datos 
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• 

• 
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•  • 
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1.19 

1.26 

1 

1.33 

1.40 

1 
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Graficas  de  tallo  y  hoja 

Otra  forma  sencilla  de  exhibit-  la  distribucion  de  un  conjunto  de  datos  cuantitativos  es  la 
grafica  de  tallo  y  hoja.  Esta  grafica  presenta  una  exhibition  grafica  de  los  datos  usando 
los  valores  numericos  reales  de  cada  punto  de  datos. 


1.  Divida  cada  segmento  en  dos  partes:  el  tallo  y  las  hojas. 

2.  Ponga  en  lista  los  tallos  en  una  columna,  con  una  ltnea  vertical  a  su  derecha. 

3.  Para  cada  medicion,  registre  la  parte  de  hoja  en  el  mismo  renglon  como  su  tallo 
correspondiente. 


4.  Ordene  las  hojas  de  menor  a  mayor  en  cada  tallo. 

5.  De  una  clave  a  su  codification  de  tallo  y  hoja  para  que  el  lector  pueda  recrear 
las  mediciones  reales  si  es  necesario. 


La  tabla  1.7  es  una  lista  de  precios  (en  dolares)  de  19  marcas  de  zapatos  deportivos. 
Construya  una  grafica  de  tallo  y  hoja  para  mostrar  la  distribucion  de  los  datos. 
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tabla  1.7  Precios  de  zapatos  deportivos 


90 

70 

70 

70 

75 

70 

65 

68 

60 

74 

70 

95 

75 

70 

68 

65 

40 

65 

70 


Solucion  Para  crear  el  tallo  y  hoja,  se  puede  dividir  cada  observation  entre  las  uni- 
dades  y  las  decenas.  El  numero  a  la  izquierda  es  el  tallo;  el  de  la  derecha  es  la  hoja. 
Entonces,  para  los  zapatos  que  cuestan  $65,  el  tallo  es  6  y  la  hoja  es  5.  Los  tallos,  que  van 
de  4  a  9,  aparecen  en  la  figura  1 . 10,  junto  con  las  hojas  para  cada  una  de  las  19  medicio- 
nes.  Si  indicamos  que  la  unidad  de  hoja  es  1,  el  lector  vera  que  el  tallo  y  hoja  6  y  8,  por 
ejemplo,  representan  el  numero  68  registrado  al  dolar  mas  cercano. 


FIGURA  1.10 

Grafica  de  tallo  y  hoja  para 
los  datos  de  la  tabla  1.7 
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CONSEJO 


tallo  |  hoja 


A  veces  las  opciones  de  tallo  disponibles  resultan  en  una  grafica  que  contiene  muy 
pocos  tallos  y  un  gran  numero  de  hojas  dentro  de  cada  tallo.  En  esta  situation,  se  pueden 
prolongar  los  tallos  al  dividir  cada  uno  en  varias  lineas,  dependiendo  de  los  valores  de 
hojas  que  se  les  asignen.  Por  lo  general  los  tallos  se  dividen  en  una  de  dos  formas: 


•  En  dos  lineas,  con  las  hojas  0-4  en  la  primera  linea  y  las  hojas  5-9  en  la  segunda 
linea 


•  En  cinco  lineas,  con  las  hojas  0-1,  2-3,  4-5,  6-7  y  8-9  en  las  cinco  lineas,  respecti- 
vamente 

Los  datos  de  la  tabla  1.8  son  los  pesos  de  30  bebes  de  gestation  completa  al  momento 
de  nacer,  nacidos  en  un  hospital  metropolitano  y  registrados  al  decimo  de  libra  mas  cer¬ 
cano.1  Construya  una  grafica  de  tallo  y  hoja  para  mostrar  la  distribution  de  los  datos. 


TABLA  1.S  Pesos  de  30  bebes  de  gestation  completa  al  momento  de  nacer 


7.2 

7.8 

6.8 

6.2 

8.2 

8.0 

8.2 

5.6 

8.6 

7.1 

8.2 

7.7 

7.5 

7.2 

7.7 

5.8 

6.8 

6.8 

8.5 

7.5 

6.1 

7.9 

9.4 

9.0 

7.8 

8.5 

9.0 

7.7 

6.7 

7.7 

Solucion  Los  datos,  aun  cuando  estan  registrados  a  una  precision  de  solo  un  lugar 
decimal,  son  mediciones  de  la  variable  continua  x  =  peso,  que  puede  tomar  cualquier 
valor  positivo.  Al  examinar  la  tabla  1.8,  se  puede  ver  rapidamente  que  los  pesos  mas  alto 
y  mas  bajo  son  9.4  y  5.6,  respectivamente.  Pero,  ^como  estan  distribuidos  los  pesos 
restantes? 
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Si  se  usa  el  punto  decimal  como  linea  divisoria  entre  el  tallo  y  las  hojas,  tenemos  solo 
cinco  tallos  que  no  producen  una  imagen  muy  buena.  Cuando  se  divide  cada  uno  de  los 
tallos  en  dos  ltneas,  hay  ocho  tallos  porque  la  primera  linea  del  tallo  5  y  la  segunda  linea 
del  tallo  9  estan  vacias.  Esto  produce  una  grafica  mas  descriptiva,  como  se  muestra  en  la 
figura  1.11.  Para  estos  datos,  la  unidad  de  hoja  es  .  1  y  el  lector  puede  inferir  que  el  tallo 
y  hoja  8  y  2,  por  ejemplo,  representan  la  medicion  x  =  8.2. 


FIGURA  1.11 

5 

Grafica  de  tallo  y  hoja  para  ^ 

los  datos  de  la  tabla  1.8  ^ 
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Unidad  de  hoja  =  .1 
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Si  la  grafica  de  tallo  y  hoja  se  gira  hacia  un  lado,  de  modo  que  la  recta  vertical  sea 
ahora  un  eje  horizontal,  se  puede  ver  que  los  datos  se  han  “apilado”  o  se  han  “distri- 
buido”  a  lo  largo  del  eje,  de  modo  que  se  puede  describir  como  “forma  de  monticulo”. 
Esta  grafica  de  nuevo  muestra  que  los  pesos  de  estos  30  recien  nacidos  varfa  entre  5.6 
y  9.4;  muchos  pesos  estan  entre  7.5  y  8.0  libras. 


Interpretation  de  graficas  con  ojo  crftico 

Una  vez  creada  una  grafica  o  graficas,  para  un  conjunto  de  datos,  yque  se  debe  buscar  al 
tratar  de  describir  los  datos? 

•  Primero,  verificar  las  escalas  horizontales  y  verticales,  de  manera  que  haya  clari- 
dad  respecto  a  lo  que  se  mide. 

•  Examinar  el  lugar  de  la  distribucion  de  datos.  yDondc  esta  el  centra  de  distri¬ 
bucion  del  eje  horizontal?  Si  se  comparan  dos  distribuciones,  <  estan  centradas  en 
el  mismo  lugar? 

•  Examinar  la  forma  de  la  distribucion.  yLa  distribucion  tiene  un  “pico”,  un  punto 
que  es  mas  alto  que  cualquier  otro?  Si  es  asi,  esta  es  la  medicion  o  categorfa  que 
se  presenta  con  mas  frecuencia.  ^Hay  mas  de  un  pico?  yHay  un  ntimero  aproxi- 
madamente  igual  de  mediciones  a  la  izquierda  y  derecha  del  pico? 

•  Buscar  cualesquiera  mediciones  poco  comunes  o  resultados  attpicos.  Esto  es, 
yliay  mediciones  mucho  mayores  o  menores  que  todas  las  otras?  Estos  resultados 
attpicos  pueden  no  ser  representatives  de  los  otros  valores  del  conjunto. 

Es  frecuente  que  las  distribuciones  se  describan  segtin  sus  formas. 


Definicion  Una  distribucion  es  simetrica  si  los  lados  izquierdo  y  derecho  de  la  dis¬ 
tribucion,  cuando  se  divide  en  el  valor  medio,  forman  imagenes  espejo. 

Una  distribucion  esta  sesgada  a  la  derecha  si  una  proporcion  mas  grande  de  las  medi¬ 
ciones  se  encuentra  a  la  derecha  del  valor  pico.  Las  distribuciones  sesgadas  a  la  dere¬ 
cha  contienen  pocas  mediciones  anormalmente  grandes. 
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Una  distribucion  esta  sesgada  a  la  izquierda  si  una  proporcion  mayor  de  las  mediciones 
esta  a  la  izquierda  del  valor  pico.  Las  distribuciones  sesgadas  a  la  izquierda  contienen 
pocas  mediciones  anormalmente  grandes. 

Una  distribucion  es  unimodal  si  tiene  un  pico;  una  distribucion  bimodal  tiene  dos 
picos.  Las  distribuciones  bimodales  representan  a  veces  una  combination  de  dos  pobla- 
ciones  diferentes  del  conjunto  de  datos. 


Examine  las  tres  graficas  de  puntos  generadas  por  MINITAB  y  que  se  muestran  en  la 
figura  1.12.  Describa  estas  distribuciones  en  terminos  de  sus  ubicaciones  y  formas. 


CONSEJO 


Simetrica  <=>  imageries 
espejo 


Sesgada  a  la  derecha 
cola  larga  a  la  derecha 


Sesgada  a  la  izquierda  <=> 
cola  larga  a  la  izquierda 


Solucion  La  primera  grafica  de  puntos  muestra  una  distribucion  relativamente  sime¬ 
trica  con  un  solo  pico  situado  en  x  =  4.  Si  se  dobla  la  pagina  en  este  pico,  las  mitades 
izquierda  y  derecha  casi  serfan  imagenes  espejo.  La  segunda  grafica,  no  obstante,  esta 
lejos  de  ser  simetrica.  Tiene  una  larga  “cola  derecha”,  lo  cual  significa  que  hay  unas 
pocas  observaciones  extraordinariamente  grandes.  Si  se  dobla  la  pagina  en  el  pico,  esta- 
rfa  en  el  lado  derecho  una  proporcion  mas  grande  de  mediciones  que  en  el  izquierdo. 
Esta  distribucion  esta  sesgada  a  la  derecha.  Del  mismo  modo,  la  tercera  grafica  de  pun¬ 
tos  con  una  larga  “cola  a  la  izquierda”  esta  sesgada  a  la  izquierda. 


Un  asistente  administrativo  del  departamento  de  atletismo  de  una  universidad  local  esta 
observando  los  promedios  de  calificaciones  de  ocho  miembros  del  equipo  femenil  de 
volibol.  El  asistente  introduce  los  promedios  en  la  base  de  datos  pero  por  accidente 
coloca  mal  el  punto  decimal  de  la  ultima  entrada. 


2.8  3.0  3.0  3.3  2.4  3.4  3.0  .21 
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Use  una  grafica  de  puntos  para  describir  los  datos  y  descubrir  el  eiTor  del  asistente. 

Solucion  La  grafica  de  puntos  de  este  pequeno  conjunto  de  datos  se  muestra  en  la 
figura  1.13a).  Claramente  se  puede  ver  el  resultado  atfpico  u  observation  poco  comiin 
causada  por  el  error  del  asistente  al  introducir  los  datos.  Una  vez  corregido  el  error, 
como  en  la  figura  1.13b),  se  puede  ver  la  distribucion  correcta  del  conjunto  de  datos. 
Como  este  es  un  conjunto  muy  pequeno,  es  diffcil  describir  la  forma  de  la  distribucion 
aun  cuando  parece  tener  un  valor  pico  alrededor  de  3.0  y  parece  ser  relativamente  sime- 
trica. 


FIGURA  1.13 

Distribuciones 
de  promedios  de 
calificaciones  para  el 
ejemplo  1.10 


a) 


0.5  1.0 


1.5  2.0 

Promedios 


2.5 


•  • 

— 

3.5 


b) 


•  •  •  •  •  • 

l  l  l  l  l  l  l 

2.2  2.4  2.6  2.8  3.0  3.2  3.4 

Promedios 


Los  resultados  atipicos  estan 
lejos  del  cuerpo  principal  de 
datos. 


Cuando  se  comparen  graficas  creadas  para  dos  conjuntos  de  datos,  se  deben  comparar 
sus  escalas  de  medicion,  ubicaciones  y  formas,  y  buscar  mediciones  poco  comunes  o 
resultados  atipicos.  Recuerde  que  estos  ultimos  no  siempre  son  causados  por  errores 
o  introduction  erronea  de  datos.  A  veces  dan  information  muy  valiosa  que  no  debe  ser 
soslayada.  Es  posible  que  sea  necesaria  mas  information  para  determinar  si  un  resultado 
atipico  es  una  medicion  valida  que  solo  sea  anormalmente  grande  o  pequena,  o  si  ha 
habido  algun  tipo  de  error  en  la  recoleccion  de  datos.  Si  las  escalas  difieren  en  mucho, 
debe  tenerse  cuidado  al  hacer  comparaciones  o  jsacar  conclusiones  que  pudieran  ser 
imprecisas ! 


HISTOGRAMAS  DE  FRECUENCIA 
RELATIVA 

Un  histograma  de  frecuencia  relativa  es  semejante  a  una  grafica  de  barras,  pero  se  usa  para 
graficar  cantidades  en  lugar  de  datos  cualitativos.  Los  datos  de  la  tabla  1.9  son  los  pesos 
de  30  bebes  de  gestation  completa  al  momento  de  nacer,  reproducidos  del  ejemplo  1.8  y 
mostrados  como  grafica  de  puntos  en  la  figura  1 . 14a).  Primero,  dividimos  el  intervalo  de 
las  mediciones  mas  pequenas  a  las  mas  grandes  en  subintervalos  o  closes  de  igual  lon- 
gitud.  Si  se  ponen  en  columna  los  puntos  de  cada  subintervalo  (figura  1.14b))  y  se  traza 
una  barra  sobre  cada  una  de  las  columnas,  se  habra  creado  un  histograma  de  frecuencia 
o  un  histograma  de  frecuencia  relativa,  dependiendo  de  la  escala  del  eje  vertical. 
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tabla  1.9  Pesos  de  30  bebes  de  gestacion  completa  al  momento  de  nacer 


7.2 

CO 

r-^ 

6.8 

6.2 

8.2 

8.0 

8.2 

5.6 

8.6 

7.1 

8.2 

7.7 

7.5 

7.2 

7.7 

5.8 

6.8 

6.8 

8.5 

7.5 

6.1 

7.9 

9.4 

9.0 

7.8 

8.5 

9.0 

7.7 

6.7 

7.7 

FIGURA  1.14 

Como  construir  un 

•  «  • 

•  •  i*  •  • 

•  • 

*  *  *  *  * 

\  n  ii  i 

histograma  6.0  6.6  7.2 

Pesos  a 

1  1  M" 

7.8  1  8.4  9.0  1 

1  nacer 

b) 

:  :  •  | - , 

1  1 

6.0  6.5 

1  l  l  l  l  1 

7.0  7.5  8.0  8.5  9.0  9.5 

Pesos  al  nacer 


Definicion  Un  histograma  de  frecuencia  relativa,  para  un  conjunto  de  datos  cuan- 
titativo  es  una  grafica  de  barras  en  la  que  la  altura  de  la  barra  muestra  “con  que  fre¬ 
cuencia”  (medida  como  proporcion  o  frecuencia  relativa)  las  mediciones  caen  en  una 
clase  o  subintervalo  particular.  Las  clases  o  subintervalos  se  grafican  a  lo  largo  del  eje 
horizontal. 


Como  regia  practica,  el  numero  de  clases  debe  ser  de  5  a  12;  cuantos  mas  datos  haya, 
mas  clases  se  requieren. '  Las  clases  deben  ser  escogidas  para  que  cada  una  de  las  medi¬ 
ciones  caiga  en  una  clase  y  solo  en  una.  Para  los  pesos  al  nacer  que  se  muestran  en  la 
tabla  1.9,  decidimos  usar  intervalos  de  peso  de  igual  longitud.  Como  el  intervalo  de 
pesos  al  nacer  es 

9.4  -  5.6  =  3.8 

el  ancho  mfifimo  de  clase  necesario  para  cubrir  el  margen  de  los  datos  es  (3.8  -t-  8) 
=  .475.  Para  mas  comodidad,  redondeamos  este  ancho  aproximado  a  .5.  Empezando  el 
primer  intervalo  al  valor  mas  bajo,  5.6,  formamos  subintervalos  de  5.6  hasta  pero  no 
incluyendo  6. 1 , 6. 1  hasta  pero  no  incluyendo  6.6,  y  asi  sucesivamente.  Usando  el  metodo 
de  inclusion  izquierda  e  incluyendo  el  punto  de  frontera  de  clase  izquierda  pero  no  el 
punto  de  frontera  derecha  en  la  clase,  eliminamos  cualquier  confusion  acerca  de  donde 
poner  una  medicion  que  resulte  caer  en  un  punto  de  frontera  de  clase. 

La  tabla  1.10  muestra  las  ocho  clases,  marcadas  de  1  a  8  para  identification.  Las  fron- 
teras  para  las  ocho  clases,  junto  con  un  total  del  numero  de  mediciones  que  caen  en  cada 
una  de  ellas,  tambien  se  muestran  en  la  tabla.  Al  igual  que  con  las  graficas  de  la  section 
1.3,  podemos  ahora  medir  con  que  frecuencia  se  presenta  cada  clase  usando  frecuencia 
o  frecuencia  relativa. 


f  Es  posible  emplear  esta  tabla  como  gufa  para  seleccionar  un  numero  apropiado  de  clases.  Recuerde  que  esto  es 
solo  una  guia;  puede  usar  mas  o  menos  clases  de  las  que  recomienda  la  tabla  si  con  ello  se  hace  mas  descriptiva 
la  grafica. 

Tamano  de  muestra  25  50  100  200  500 

Numero  de  clases  6  7  8  9  10 
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Para  construir  el  histograma  de  frecuencia  relativa,  grafique  las  fronteras  de  clase  a  lo 
largo  del  eje  horizontal.  Trace  una  barra  sobre  cada  intervalo  de  clase,  con  altura  igual 
a  la  frecuencia  relativa  para  esa  clase.  El  histograma  de  frecuencia  relativa  para  los  da- 
tos  de  peso  al  nacer,  figura  1.15,  muestra  de  un  vistazo  la  forma  en  que  estan  distribui- 
dos  los  pesos  al  nacer  en  el  intervalo  de  5.6  a  9.4. 


TABLA  1.10 


Frecuencias  relativas  para  los  datos  de  la  tabla  1 .9 

Frecuencia 


(ffl  CONSEJO 

Clase 

Fronteras 
de  clase 

Total 

Frecuencia 
de  clase 

relativa 

clase 

Las  frecuencias  relativas 

1 

5.6  a  <6.1 

II 

2 

2/30 

totalizan  1;  las  frecuencias,  n. 

2 

6.1  a  <6.6 

II 

2 

2/30 

3 

6.6  a  <7.1 

INI 

4 

4/30 

4 

7.1  a  <7.6 

till 

5 

5/30 

5 

7.6  a  <8.1 

Ilk  III 

8 

8/30 

6 

8.1  a  <8.6 

HR 

5 

5/30 

7 

8.6  a  <9.1 

III 

3 

3/30 

8 

9.1  a  <9.6 

1 

1 

1/30 

Veinticinco  clientes  de  Starbucks®  son  entrevistados  en  una  encuesta  de  mercadeo  y 
se  les  pregunta,  con  que  frecuencia  visita  usted  Starbucks  en  una  semana  tipica ?”  La 
tabla  1.11  es  una  lista  de  respuestas  para  estos  25  clientes.  Construya  un  histograma  de 
frecuencia  relativa  para  describir  los  datos. 


TABLA  1.11  Numero  de  visitas  en  una  semana  tipica  para  25  clientes 

6  7  15  6 

4  6  4  6  8 

6  5  6  3  4 

5  5  5  7  6 

3  5  7  5  5 


Solucion  La  variable  que  se  mide  es  el  “numero  de  visitas  a  Starbucks”,  que  es  una 
variable  discreta  que  toma  solo  valores  enteros.  En  este  caso,  lo  mas  sencillo  es  escoger 
las  clases  o  subintervalos  como  los  valores  enteros  en  el  rango  de  valores  observados: 
1,  2,  3, 4,  5,  6  y  7.  La  tabla  1.12  muestra  las  clases  y  sus  frecuencias  correspondientes  y 
frecuencias  relativas.  El  histograma  de  frecuencia  relativa,  generada  usando  MINITAB,  se 
muestra  en  la  figura  1.16. 
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tabla  112  Tabla  de  frecuencia  para  el  ejemplo  1.11 


Numero  de  visitas 
a  Starbucks 

Frecuencia 

Frecuencia 

relativa 

1 

1 

.04 

3 

2 

.08 

4 

3 

.12 

5 

8 

.32 

6 

7 

.28 

7 

3 

.12 

8 

1 

.04 

FIGURA  1.16 

Histograma  del  MINITAB 
para  el  ejemplo  1.11 


Observe  que  la  distribution  esta  sesgada  a  la  izquierda  y  que  hay  una  brecha  entre 

1  y  3. 


^Como  construyo  un  histograma  de  frecuencia  relativa? 


1.  Escoja  el  numero  de  clases,  por  lo  general  entre  5  y  12.  Cuantos  mas  datos  se 
tengan,  mas  clases  deben  usarse. 

2.  Calcule  el  ancho  aproximado  de  clase  al  dividir  la  diferencia  entre  los  valores 
maximo  y  mi'nimo  entre  el  numero  de  clases. 

3.  Redondee  el  ancho  aproximado  de  clase  hasta  un  numero  comodo. 

4.  Si  los  datos  son  discretos,  se  puede  asignar  una  clase  para  cada  valor  entero 
tornado  por  los  datos.  Para  un  numero  grande  de  valores  enteros,  puede  que  sea 
necesario  agruparlos  en  clases. 

5.  Localice  las  fronteras  de  clase.  La  clase  mas  baja  puede  incluir  la  medicion  mas 
pequena.  A  continuation  sume  las  clases  restantes  usando  el  metodo  de  inclusion 
izquierda. 

6.  Construya  una  tabla  estadfstica  que  contenga  las  clases,  sus  frecuencias  y  sus 
frecuencias  relativas. 

7.  Construya  un  histograma  como  una  barra  de  graficas,  graficando  intervalos 
de  clase  en  el  eje  horizontal  y  frecuencias  relativas  como  las  alturas  de  las 
barras. 


(continua) 
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Repertorio  de  ejercicios 

A.  Para  los  siguientes  conjuntos  de  datos,  encuentre  el  rango,  el  ancho  mi'nimo  de 
clase  y  un  ancho  practico  de  clase.  El  primer  conjunto  de  datos  esta  hecho  para 
usted. 


Numero  de 
mediciones 

Valores  maximo 
y  mi'nimo 

Numero  de 
clases 

Rango 

Ancho  minimo 
de  clase 

Ancho  practico 
de  clase 

50 

10a  100 

7 

25 

0.1  a  6.0 

6 

100 

500  a  700 

8 

B.  Para  los  mismos  conjuntos  de  datos,  seleccione  un  punto  inicial  conveniente 
y  haga  una  lista  de  fronteras  de  clase  para  las  primeras  dos  clases.  El  primer 
conjunto  de  datos  esta  hecho  para  usted. 


Numero  de 
mediciones 

Valores  maximo 
y  minimo 

Punto  inicial 
conveniente 

Primeras  dos 
clases 

50 

10  a  100 

0 

25 

0.1  a  6.0 

100 

500  a  700 

Informe  de  progreso 

•  ■  Todav fa  tiene  problemas?  Pruebe  de  nuevo  usando  las  Repeticiones  de  un 
ejercicio  del  final  de  esta  seccion. 

•  ^Ya  domina  los  histogramas  de  frecuencia  relativa?  Puede  saltarse  el  reperto¬ 
rio  de  ejercicios  y  pasar  directo  a  los  ejercicios  de  Tecnicas  basicas  del  final 
de  esta  seccion. 

Las  respuestas  se  encuentran  al  final  de  este  libro. 


Se  puede  usar  un  histograma  de  frecuencia  relativa  para  describir  la  distribucion  de 
un  conjunto  de  datos  en  terminos  de  su  ubicacion  y  forma,  y  ver  si  hay  resultados  ati'pi- 
cos  como  lo  hizo  usted  con  otras  graficas.  Por  ejemplo,  los  datos  de  peso  al  nacimiento 
fueron  relativamente  simetricos,  sin  mediciones  poco  comunes,  en  tanto  que  los  datos 
de  Starbucks  estuvieron  sesgados  a  la  izquierda.  Como  la  barra  construida  arriba  de  cada 
clase  representa  la  frecuencia  relativa  o  proporcion  de  las  mediciones  en  esa  clase,  estas 
alturas  se  pueden  usar  para  darnos  information  adicional: 

•  La  proporcion  de  las  medidas  que  caen  en  una  clase  o  grupo  particular  de  clases 

•  La  probabilidad  de  que  una  medida  tomada  al  azar  del  conjunto  caera  en  una 
clase  particular  o  grupo  de  clases 

Considere  el  histograma  de  frecuencia  relativa  para  los  datos  del  peso  al  nacimiento 
de  la  figura  1.15.  f,Que  proporcion  de  los  recien  nacidos  tienen  al  nacer  pesos  de  7.6  o 
mayores?  Esto  abarca  todas  las  clases  de  mas  de  7.6  en  la  tabla  1 .10.  Como  hay  17  recien 
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nacidos  en  esas  clases,  la  proportion  de  quienes  tienen  pesos  al  nacer  de  7.6  o  mas  es 
17/30,  o  sea  alrededor  de  57%.  Este  tambien  es  el  porcentaje  del  area  total  bajo  el  histo- 
grama  de  la  figura  1.15  que  esta  a  la  derecha  de  7.6. 

Supongamos  que  usted  escribio  cada  uno  de  los  30  pesos  al  nacer  en  un  papel,  los 
puso  en  un  sombrero  y  saco  uno  de  ellos  al  azar.  ^Cual  es  la  probabilidad  de  que  este 
papel  contenga  un  peso  de  7.6  al  nacimiento  o  mas  alto?  Como  17  de  los  30  peque- 
nos  papeles  caen  en  esta  categorfa,  hay  17  probabilidades  en  30;  esto  es,  la  probabilidad 
es  17/30.  La  palabra  probabilidad  no  es  desconocida  para  el  lector;  la  estudiaremos  en 
mas  detalle  en  el  capitulo  4. 

Aun  cuando  estamos  interesados  en  describir  un  conjunto  de  n  =  30  mediciones, 
tambien  podrfamos  estar  interesados  en  la  poblacion  de  donde  se  saco  la  muestra,  que  es 
el  conjunto  de  pesos  al  nacer  de  todos  los  bebes  nacidos  en  este  hospital.  O  bien,  si  esta¬ 
mos  interesados  en  los  pesos  de  recien  nacidos  en  general,  podrfamos  considerar  nuestra 
muestra  como  representativa  de  la  poblacion  de  pesos  al  nacer  para  recien  nacidos  en 
hospitales  metropolitanos  similares.  Un  histograma  de  muestra  da  valiosa  information 
acerca  del  histograma  de  poblacion,  es  decir,  la  grafica  que  describe  la  distribution  de 
toda  la  poblacion.  Recuerde,  sin  embargo,  que  diferentes  muestras  de  la  misma  pobla¬ 
cion  produciran  histogramas  diferentes,  aun  cuando  se  usen  fronteras  de  la  misma  clase. 
No  obstante,  puede  esperarse  que  los  histogramas  de  la  muestra  y  poblacion  sean  simila¬ 
res.  Al  agregar  mas  y  mas  datos  a  la  muestra,  los  dos  histogramas  se  hacen  cada  vez  mas 
semej antes.  jSi  se  agranda  la  muestra  para  incluir  toda  la  poblacion,  ambos  histogra¬ 
mas  son  identicos ! 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  ref i ere  n  a  la  seccion  Mi  en  tree  ad  or  personal  de  la  pagina  27. 

1.16  Para  los  siguientes  conjuntos  de  datos,  encuentre  el  rango,  el  ancho  mrnitno  de  clase 
y  ancho  practico  de  clase. 


Numero  de 
mediciones 

Valores  minimo 
y  maximo 

Numero 
de  clases 

Rango 

Ancho  minimo 
de  clase 

Ancho  practico 
de  clase 

75 

0.5  a  1.0 

8 

25 

0  a  1006 

6 

200 

1200  a  1500 

9 

1.17  Consulte  el  ejercicio  1.16.  Para  los  mismos  conjuntos  de  datos,  seleccione  un  punto 
initial  conveniente  y  haga  una  lista  de  fronteras  de  clase  para  las  primeras  dos  clases. 


Numero  de 
mediciones 

Valores  minimo 
y  maximo 

Punto  inicial 
conveniente 

Primeras 
dos  clases 

75 

0.5  a  1.0 

25 

Oa  100 

200 

1200  a  1500 
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TECNICAS  BASICAS 

(^j  datos  1.18  Construya  una  grafica  de  tallo  y  hoja  para 
Exons  estas  50  mediciones: 


3.1 

4.9 

2.8 

3.6 

2.5 

4.5 

3.5 

3.7 

4.1 

4.9 

2.9 

2.1 

3.5 

4.0 

3.7 

2.7 

4.0 

4.4 

3.7 

4.2 

3.8 

6.2 

2.5 

2.9 

2.8 

5.1 

1.8 

5.6 

2.2 

3.4 

2.5 

3.6 

5.1 

4.8 

1.6 

3.6 

6.1 

4.7 

3.9 

3.9 

4.3 

5.7 

3.7 

4.6 

4.0 

5.6 

4.9 

4.2 

3.1 

3.9 

a.  Describa  la  forma  de  la  distribucion  de  datos. 

'Ve  algunos  resultados  atfpicos? 

b.  Use  la  grafica  de  tallo  y  hoja  para  hallar  la  observation 
minima. 

c.  Encuentre  la  octava  y  novena  observaciones  mas 
grandes. 

1.19  Consulte  el  ejercicio  1.18.  Construya  un 

histograma  de  frecuencia  relativa  para  los  datos. 

a.  A p ro x  i  m adam e n te  cuantos  intervalos  de  clase  debe 
usar? 

b.  Supongamos  que  usted  decide  usar  clases  que 
empiezan  en  1.6  con  ancho  de  clase  de  .5  (es  decir, 

1.6  a  <2.1,  2.1  a  <2. 6).  Construya  el  histograma  de 
frecuencia  relativa  para  los  datos. 

c.  iQue  fraccion  de  las  mediciones  es  menor  a  5.1? 

d.  (',Que  fraccion  de  las  mediciones  es  mayor  a  3.6? 

e.  Compare  el  histograma  de  frecuencia  relativa  con 
la  grafica  de  tallo  y  hoja  del  ejercicio  1.18.  (',Son 
semejantes  las  formas? 

'(^j)  datos  1 .20  Considere  este  conjunto  de  datos: 


EXO 120 


4.5 

3.2 

3.5 

3.9 

3.5 

3.9 

4.3 

4.8 

3.6 

3.3 

4.3 

4.2 

3.9 

3.7 

4.3 

4.4 

3.4 

4.2 

4.4 

4.0 

3.6 

3.5 

3.9 

4.0 

a.  Construya  una  grafica  de  tallo  y  hoja  usando  el  dfgito 
inicial  como  tallo. 

b.  Construya  una  grafica  de  tallo  y  hoja  usando  dos  veces 
cada  uno  de  los  dfgitos  iniciales.  pEsta  tecnica  mejora 
la  presentation  de  los  datos?  Explique. 

1.21  Una  variable  discreta  puede  tomar  solo  los  valores 
de  0,  1  o  2.  Un  conjunto  de  20  mediciones  en  esta 
variable  se  muestra: 

12  10  2 
2  110  0 

2  2  110 

0  12  11 

a.  Construya  un  histograma  de  frecuencia  relativa  para 
los  datos. 


b.  ^Que  proporcion  de  las  mediciones  es  mayor  a  1  ? 

c.  pQuc  proporcion  de  las  mediciones  es  menor  a  2? 

d.  Si  una  medicion  se  selecciona  al  azar  de  entre  las  20 
mediciones  mostradas,  ^cual  es  la  probabilidad  de  que 
sea  un  2? 

d.  Describa  la  forma  de  la  distribucion.  pVe  algunos 
resultados  atfpicos? 

1.22  Consulte  el  ejercicio  1.21. 

a.  Trace  una  grafica  de  puntos  para  describir  los  datos. 

b.  pComo  podrfa  usted  definir  el  tallo  y  la  hoja  para  este 
conjunto  de  datos? 

c.  Trace  la  grafica  de  tallo  y  hoja  usando  su  decision  del 
inciso  b). 

d.  Compare  la  grafica  de  puntos,  la  grafica  de  tallo  y 
hoja  y  el  histograma  de  frecuencia  relativa  (ejercicio 
1.21).  p Ue van  todos  ellos  mas  o  menos  la  misma 
information? 

1.23  Navegar  en  un  laberinto  Unpsicologo 
experimental  midio  el  tiempo  que  tardo  una  rata  para 
navegar  con  exito  por  un  laberinto  en  cada  uno  de  cinco 
dfas.  Los  resultados  se  muestran  en  la  tabla  siguiente. 
Genere  una  grafica  de  lfneas  para  describir  los  datos. 
pPiensa  usted  que  hay  algun  aprendizaje? 


Dia 

12  3  4 

5 

Tiempo  (seg.) 

45  43  46  32 

25 

(^)datos  1.24  Medicion  en  el  tiempo  El  valor  de 

una  variable  cuantitativa  se  mide  una  vez  al  ano 
durante  un  periodo  de  10  anos.  He  aquf  los  datos: 


Ano 

Medicion 

Ano 

Medicion 

1 

61.5 

6 

58.2 

2 

62.3 

7 

57.5 

3 

60.7 

8 

57.5 

4 

59.8 

9 

56.1 

5 

58.0 

10 

56.0 

a.  Genere  una  grafica  de  lfneas  para  describir  la  variable 
cuando  cambie  con  el  tiempo. 

b.  Describa  las  mediciones  usando  la  grafica  construida 
en  el  inciso  a). 

jJJ); datos  1.25  Calificaciones  de  examen  Las 

calificaciones  en  un  examen  de  100  puntos  se 
registraron  para  20  estudiantes: 

61  93  91  86  55  63  86  82  76  57 

94  89  67  62  72  87  68  65  75  84 

a.  Use  una  grafica  apropiada  para  describir  los  datos. 

b.  Describa  la  forma  y  ubicacion  de  las  calificaciones. 
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c.  ^Es  poco  comiin  la  forma  de  la  distribucion?  ^Puede 
usted  considerar  alguna  razon  por  la  que  la 
distribucion  de  las  calificaciones  tendria  esa  forma? 

APLICACIONES 

(^)datos  1.26  Una  enfermedad  recurrente 

El  tiempo  (en  meses)  entre  el  inicio  de  una 
enfermedad  en  particular  y  su  recurrencia  se  registro  para 


n  = 

2.1 

50  pacientes: 

4.4  2.7  32.3 

9.9 

9.0 

2.0 

6.6 

3.9 

1.6 

14.7 

9.6 

16.7 

7.4 

8.2 

19.2 

6.9 

4.3 

3.3 

1.2 

4.1 

18.4 

.2 

6.1 

13.5 

7.4 

.2 

8.3 

.3 

1.3 

14.1 

1.0 

2.4 

2.4 

18.0 

8.7 

24.0 

1.4 

8.2 

5.8 

1.6 

3.5 

11.4 

18.0 

26.7 

3.7 

12.6 

23.1 

5.6 

.4 

a.  Construya  un  histograma  de  frecuencia  relativa  para 
los  datos. 

b.  <, Describin';!  usted  la  forma  como  aproximadamente 
simetrica,  sesgada  a  la  derecha  o  sesgada  a  la 
izquierda? 

c.  De  la  fraccion  de  tiempos  de  recurrencia  menores  o 
iguales  a  10  meses. 

1.27  La  educacion  funciona  La  educacion 
funciona,  segun  una  instantanea  dada  en  un  informe  a  la 
ciudad  de  Riverside  por  la  Direction  de  Educacion7  del 
mismo  condado.  El  promedio  de  ingresos  anuales  para 
seis  niveles  diferentes  de  educacion  se  muestra  en  la 
tabla: 


a.  Construya  una  grafica  de  tallo  y  hoja  para  los  datos. 

b.  Construya  un  histograma  de  frecuencia  relativa  para 
estos  datos.  Empiece  en  la  frontera  inferior  de  la 
primera  clase  en  30  y  use  un  ancho  de  clase  de  5  meses. 

c.  Compare  las  graficas  de  los  incisos  a)  y  b). H ay 
alguna  diferencia  importante  que  le  harfa  escoger  una 
como  el  mejor  metodo  para  exhibir  los  datos? 

d.  <^Que  proportion  de  los  ninos  tenfan  35  meses 

(2  anos,  1 1  meses)  o  mas,  pero  menos  de  45  meses 
(3  anos,  9  meses)  de  edad  cuando  se  inscribieron 
por  primera  vez  en  preescolar? 

e.  Si  un  nino  fuera  seleccionado  al  azar  de  este  grupo  de 
ninos,  ^cual  es  la  probabilidad  de  que  tuviera  menos 
de  50  meses  de  edad  (4  anos,  2  meses)  cuando  se 
inscribio  por  primera  vez  en  preescolar? 

(^datos  1.29  Religion  organizada  Las 

estadisticas  de  las  religiones  del  mundo  son 
aproximaciones  muy  vagas,  dado  que  muchas  religiones 
no  dan  seguimiento  a  sus  miembros.  Una  estimacion 
de  estos  numeros  (en  millones)  se  muestra  en  la  tabla 
siguiente.8 


Religion 

Miembros 

(millones) 

Religion 

Miembros 

(millones) 

Budismo 

375 

Judaismo 

15 

Cristianismo 

2100 

Sijismo 

25 

Hinduismo 

851 

Otras 

21 

Islamismo 

1300 

Fuente:  Time  Almanac  2007 


Nivel  de  educacion  Promedio  de  ingreso  anual 

Secundaria  terminada  $26795 

Universidad,  sin  tftulo  29095 

Titulo  de  licenciatura  50  623 

Tftulo  de  maestrla  63592 

Doctorado  85675 

Profesional  (medico,  abogado)  1 01  375 

Fuente:  U.S.  Census  Bureau 

a.  i,Que  metodos  graficos  podrfa  usted  usar  para  describir 
los  datos? 

b.  Seleccione  el  metodo  del  inciso  a)  que  usted  piensa 
describe  mejor  los  datos. 

c.  (',C6mo  podrfa  resumir  la  informacion  mostrada  en  la 
grafica  respecto  a  niveles  educativos  y  salario? 

(^1  datos  1.28  Preescolar  A  continuacion  se  dan  las 
edades  (en  meses)  a  los  que  se  inscribieron  por 
primera  vez  50  ninos  en  una  escuela  preescolar. 


38 

40 

30 

35 

39 

40 

48 

36 

31 

36 

47 

35 

34 

43 

41 

36 

41 

43 

48 

40 

32 

34 

41 

30 

46 

35 

40 

30 

46 

37 

55 

39 

33 

32 

32 

45 

42 

41 

36 

50 

42 

50 

37 

39 

33 

45 

38 

46 

36 

31 

a.  Construya  una  grafica  de  pastel  para  describir  el  total 
de  miembros  en  las  religiones  organizadas  del  mundo. 

b.  Construya  una  grafica  de  barras  para  describir  el  total 
de  miembros  en  las  religiones  organizadas  del  mundo. 

c.  Ordene  los  grupos  religiosos  del  numero  menor  al 
mayor  de  miembros.  Construya  una  grafica  de  Pareto 
para  describir  los  datos.  /,Cual  de  las  tres  es  mas 
efectiva? 

(^)datos  1.30  iQue  tan  larga  es  la  fila?  Para 

determinar  el  numero  de  cajas  de  pago  que 
en  el  futuro  es  necesario  construir,  una  cadena  de 
supermercados  desea  obtener  informacion  del  tiempo  (en 
minutos)  necesario  para  dar  servicio  a  clientes. 

Para  hallar  la  distribucion  de  tiempos  de  tal  servicio, 
se  registro  una  muestra  de  1000  tiempos.  Sesenta  de 
estos  se  muestran  a  continuacion: 


3.6 

1.9 

2.1 

.3 

.8 

.2 

1.0 

1.4 

1.8 

1.6 

1.1 

1.8 

.3 

1.1 

.5 

1.2 

.6 

1.1 

.8 

1.7 

1.4 

.2 

1.3 

3.1 

.4 

2.3 

1.8 

4.5 

.9 

.7 

.6 

2.8 

2.5 

1.1 

.4 

1.2 

.4 

1.3 

.8 

1.3 

1.1 

1.2 

.8 

1.0 

.9 

.7 

3.1 

1.7 

1.1 

2.2 

1.6 

1.9 

5.2 

.5 

1.8 

.3 

1.1 

.6 

.7 

.6 
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a.  Construya  una  grafica  de  tallo  y  hoja  para  los  datos. 

b.  ^Que  fraccion  de  los  tiempos  de  servicio  son  menores 
o  iguales  a  1  minuto? 

c.  yCual  de  las  60  mediciones  es  la  mas  pequena? 

1.31  Tiempos  de  servicio,  continua  Consulte  el 
ejercicio  1.30.  Construya  un  histograma  de  frecuencia 
relativa  para  los  tiempos  de  servicio  de  supermercado. 

a.  Describa  la  forma  de  la  distribucion.  6Ve  algunos 
resultados  atfpicos? 

b.  Suponiendo  que  los  resultados  atfpicos  de  este 
conjunto  de  datos  sean  observaciones  validas,  7,  como 
los  explicarfa  a  la  administracion  de  la  cadena  de 
supermercados? 

c.  Compare  el  histograma  de  frecuencia  relativa  con 
la  grafica  de  tallo  y  hoja  del  ejercicio  1.30.  yLas  dos 
graficas  llevan  la  misma  informacion? 

(^)datos  1.32  Contenido  de  calcio  Elcontenido 
de  calcio  (Ca)  de  una  sustancia  mineral  en 
polvo  fue  analizado  10  veces,  con  las  siguientes 
composiciones  porcentuales  registradas: 

.0271  .0282  .0279  .0281  .0268 
.0271  .0281  .0269  .0275  .0276 

a.  Trace  una  grafica  de  puntos  para  describir  los  datos. 
(sugerencia:  La  escala  del  eje  horizontal  debe  ir  de 
.0260  a  .0290.) 

b.  Trace  una  grafica  de  tallo  y  hoja  para  los  datos.  Use 
los  numeros  de  centenas  y  millares  como  tallo. 

c.  A 1  gun  as  de  las  mediciones  son  inconsistentes  con  las 
otras  mediciones,  indicando  asf  que  el  tecnico  puede 
haber  cometido  un  error  en  el  analisis? 

(^)datos  1.33  Presidentes  de  Estados  Unidos 

A  continuacion  aparecen  las  edades,  al 
momenta  de  su  fallecimiento,  de  los  38  presidentes  ya 
desaparecidos  desde  George  Washington  a  Ronald  Reagan:5 


Washington 

67 

Garfield 

49 

J.  Adams 

90 

Arthur 

56 

Jefferson 

83 

Cleveland 

71 

Madison 

85 

B.  Harrison 

67 

Monroe 

73 

Cleveland 

71 

J.  Q.  Adams 

80 

McKinley 

58 

Jackson 

78 

T.  Roosevelt 

60 

Van  Buren 

79 

Taft 

72 

W.  H.  Harrison 

68 

Wilson 

67 

Tyler 

71 

Harding 

57 

Polk 

53 

Coolidge 

60 

Taylor 

65 

Hoover 

90 

Fillmore 

74 

F.  D.  Roosevelt 

63 

Pierce 

64 

Truman 

88 

Buchanan 

77 

Eisenhower 

78 

Lincoln 

56 

Kennedy 

46 

A.  Johnson 

66 

L.  Johnson 

64 

Grant 

63 

Nixon 

81 

Hayes 

70 

Reagan 

93 

a.  Antes  de  graficar  los  datos,  trate  de  visualizar  la 
distribucion  de  las  edades  al  fallecimiento  de  los 
presidentes.  ^Que  forma  piensa  usted  que  tendra? 

b.  Construya  una  grafica  de  tallo  y  hoja  para  los  datos. 
Describa  la  forma.  yLe  sorprende? 

c.  Los  cinco  presidentes  mas  jovenes  al  momenta  de 
su  fallecimiento  aparecen  en  la  “cola”  inferior  de  la 
distribucion.  Tres  de  los  cinco  mas  jovenes  tienen  una 
caracterfstica  comun.  Identifique  los  cinco  presidentes 
mas  jovenes  a  su  fallecimiento.  yQue  caracterfstica 
comun  explica  estas  mediciones? 

((^)datos  1.34  Cantidades  de  globulos  rojos 

La  cantidad  de  globulos  rojos  de  una  persona 
sana  se  midio  en  cada  uno  de  15  dfas.  El  numero 
registrado  se  midio  en  106  celulas  por  microlitro  (|xL). 


5.4 

5.2 

5.0 

5.2 

5.5 

5.3 

5.4 

5.2 

5.1 

5.3 

5.3 

4.9 

5.4 

5.2 

5.2 

a.  Use  una  grafica  apropiada  para  describir  los  datos. 

b.  Describa  la  forma  y  ubicacion  de  las  cantidades  de 
globulos  rojos. 

c.  Si  la  cantidad  de  globulos  rojos  de  la  persona  se  mide 
hoy  como  5.7  X  I  06/jjlL,  justed  considerarfa  que  esto 
es  poco  comun?  yQue  conclusiones  podrfa  sacar? 

jJlj) datos  1.35  Campeones  de  bateo  Los  directivos 
del  beisbol  de  ligas  mayores  han  coronado 
a  un  campeon  de  bateo  en  la  Liga  Nacional  cada  ano 
desde  1876.  En  la  tabla  siguiente  aparece  una  muestra  de 
promedios  ganadores  de  bateo:5 


Ano 

Nombre 

Promedio 

2005 

Derreck  Lee 

.335 

2000 

Todd  Helton 

.372 

1915 

Larry  Doyle 

.320 

1917 

Edd  Roush 

.341 

1934 

Paul  Waner 

.362 

1911 

Honus  Wagner 

.334 

1898 

Willie  Keeler 

.379 

1924 

Roger  Hornsby 

.424 

1963 

Tommy  Davis 

.326 

1992 

Gary  Sheffield 

.330 

1954 

Willie  Mays 

.345 

1975 

Bill  Madlock 

.354 

1958 

Richie  Ashburn 

.350 

1942 

Ernie  Lombardi 

.330 

1948 

Stan  Musial 

.376 

1971 

Joe  Torre 

.363 

1996 

Tony  Gwynn 

.353 

1961 

Roberto  Clemente 

.351 

1968 

Pete  Rose 

.335 

1885 

Roger  Connor 

.371 
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a.  Construya  un  histograma  de  frecuencia  relativa 
para  describir  los  promedios  de  bateo  para  estos  20 
campeones. 

b.  Si  al  azar  usted  fuera  a  escoger  uno  de  los  20  nombres, 
7,  que  probabilidad  hay  de  que  escoja  un  jugador 
cuyo  promedio  fuera  arriba  de  .400  para  su  ano  de 
campeonato? 

(^)datos  1-36  Mejores  20  pelfculas  Latablaque 
sigue  presenta  las  ventas  brutas  de  boletos  en 
fin  de  semana  para  las  mejores  20  pelfculas,  durante  la 
semana  del  4  de  agosto  de  2006:9 

Venta  bruta 
fin  de  semana 


Pelicula  ($  millones) 


1 .  Talladega  Nights:  The  Ballad  of  Ricky  Bobby 

$47.0 

2.  Barnyard 

15.8 

3 .  Pirates  of  the  Caribbean:  Dead  Man 's  Chest 

11.0 

4.  Miami  Vice 

10.2 

5.  The  Descent 

8.9 

6.  John  Tucker  Must  Die 

6.2 

7.  Monster  House 

6.1 

8.  The  Ant  Bully 

3.9 

9.  You,  Me  and  Dupree 

3.6 

10.  The  Night  Listener 

3.6 

11.  The  Devil  Wears  Prada 

3.0 

12.  Lady  In  the  Water 

2.7 

13.  Little  Man 

2.5 

14.  Superman  Returns 

2.2 

15.  Scoop 

1.8 

1 6.  Little  Miss  Sunshine 

1.5 

17.  Clerks  II 

1.3 

18.  My  Super  Ex-Girlfriend 

1.2 

19.  Cars 

1.1 

20.  Click 

0.8 

Fuente:  www.radiofree.com/mov-tops.shtml 

a.  Trace  una  grafica  de  tallo  y  hoja  para  los  datos. 
Describa  la  forma  de  la  distribucion.  7  Hay  algunos 
resultados  atfpicos? 

b.  Construya  una  grafica  de  puntos  para  los  datos.  (',Cual 
de  las  dos  graficas  es  mas  informativa?  Explique. 

datos  1.37  Desechos  peligrosos  ^Que  tan  seguro 
es  su  vecindario?  7  Hay  algunos  lugares  con 


desechos  peligrosos  cercanos?  La  tabla  siguiente  muestra 
el  numero  de  lugares  con  desechos  peligrosos  en  cada 
uno  de  los  50  estados  de  la  union  americana  y  el  Distrito 
de  Columbia  en  el  ano  2006:5 


AL 

15 

HI 

3 

MA 

33 

NM 

13 

SD 

2 

AK 

6 

ID 

9 

Ml 

68 

NY 

87 

TN 

14 

AZ 

9 

IL 

48 

MN 

24 

NC 

31 

TX 

44 

AR 

10 

IN 

30 

MS 

5 

ND 

0 

UT 

18 

CA 

95 

IA 

12 

M0 

26 

OH 

37 

VT 

11 

CO 

19 

KS 

11 

MT 

15 

OK 

11 

VA 

28 

CT 

16 

KY 

14 

NE 

14 

OR 

11 

WA 

47 

DE 

15 

LA 

14 

NV 

1 

PA 

96 

WV 

9 

DC 

1 

ME 

12 

NH 

21 

Rl 

12 

Wl 

38 

FL 

50 

MD 

18 

NJ 

117 

SC 

26 

WY 

2 

GA 

17 

a.  7  Que  variable  se  esta  midiendo?  7  La  variable  es 
discreta  o  continua? 

b.  A  continuacion  se  muestra  una  grafica  de  tallo  y 
hoja  generada  por  MINITAB.  Describa  la  forma  de 
la  distribucion  de  datos.  Identifique  las  mediciones 
anormalmente  grandes  marcadas  “HI”  por  estado. 

Grafica  de  tallo  y  hoja:  Desechos  peligrosos 

Stem-and-leaf  of  Sites  N  =  51 

Leaf  Unit  =  1.0 


6 

0 

011223 

11 

0 

56999 

24 

1 

0111122234444 

(8) 

1 

55567889 

19 

2 

14 

17 

2 

668 

14 

3 

013 

11 

3 

78 

9 

4 

4 

8 

4 

78 

6 

5 

0 

HI 

68,  87,  95,  96 

c.  (.Puede  usted  dar  alguna  razon  por  la  que  estos  cinco 
estados  tienen  un  gran  numero  de  sitios  con  desechos 
peligrosos?  7  Que  otra  variable  podrfa  usted  medir  para 
ayudar  a  explicar  por  que  los  datos  se  comportan  asf? 


Conforme  usted  siga  trabajando  los  ejercicios  de  este  capftulo,  adquirira  mas  expe- 
riencia  para  reconocer  diferentes  tipos  de  datos  y  determinar  el  metodo  grafico  mas  apro- 
piado  a  usar.  Recuerde  que  el  tipo  de  grafica  que  use  no  es  tan  importante  como  la  inter- 
pretacion  que  acompana  a  la  imagen.  Busque  estas  importantes  caracterfsticas: 

•  Ubicacion  del  centre  de  los  datos 

•  Forma  de  la  distribucion  de  datos 

•  Observaciones  poco  comunes  del  conjunto  de  datos 
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A1  utilizar  estas  caracterfsticas  como  gufa,  podra  interpretar  y  comparar  conjuntos  de 
datos  usando  metodos  graficos,  que  son  solo  la  primera  de  numerosas  herramientas  esta- 
dfsticas  que  pronto  tendra  a  su  disposition. 


REPASO  DEL  CAPITULO 


Conceptos  clave 

I.  Como  se  generan  datos 

1 .  Unidades  experimentales,  variables,  mediciones 

2.  Muestras  y  poblaciones 

3.  Datos  univariados,  bivariados  y  multivariados 

II.  Tipos  de  variables 

1 .  Cualitativas  o  categoricas 

2.  Cuantitativas 

a.  Discretas 

b.  Continuas 

III.  Graficas  para  distribuciones 
univariadas  de  datos 

1 .  Datos  cualitativos  o  categoricos 

a.  Graficas  de  pastel 

b.  Graficas  de  barras 


2.  Datos  cuantitativos 

a.  Graficas  de  pastel  y  de  barras 

b.  Graficas  de  lfneas 

c.  Graficas  de  puntos 

d.  Graficas  de  tallo  y  hoja 

e.  Histogramas  de  frecuencia  relativa 

3.  Description  de  distribuciones  de  datos 

a.  Formas:  simetricas,  sesgadas  a  la  izquierda, 
sesgadas  a  la  derecha,  unimodales,  bimodales 

b.  Proportion  de  mediciones  en  ciertos  intervalos 

c.  Resultados  atfpicos 


El  acceso  facil  a  la  web  ha  hecho  posible  entender  conceptos  de  estadfstica  usando 
una  herramienta  interactiva  de  la  web  llamada  applet.  Estos  applets  dan  un  refuerzo 
visual  para  los  conceptos  que  se  han  presentado  en  el  capftulo.  A  veces  el  lector 
podra  realizar  experimentos  estadfsticos,  a  veces  podra  interactuar  con  una  grafica 
estadfstica  para  cambiar  su  forma  y  a  veces  podra  usar  el  applet  como  “tabla  estadfs¬ 
tica”  interactiva.  A1  final  de  cada  capftulo,  el  lector  encontrara  ejercicios  disenados 
especfficamente  para  usar  con  un  applet  en  particular. 

Los  applets  han  sido  personalizados  en  forma  especffica  para  comparar  la  presen¬ 
tation  y  notation  empleadas  en  el  texto.  Se  pueden  hallar  en  el  sitio  web  Premium. 
Si  es  necesario,  siga  las  instrucciones  para  descargar  el  ultimo  buscador  de  la  web 
y/o  conexion  a  Java,  o  simplemente  de  un  clic  en  el  vinculo  apropiado  para  cargar  los 
applets.  Su  buscador  de  la  web  abrira  el  fndice  de  applets,  organizados  por  capftulo  y 
nombre.  Cuando  haga  clic  en  un  tftulo  particular  de  applet,  este  aparecera  en  su  bus¬ 
cador.  Para  regresar  al  fndice  de  applets,  de  un  clic  en  el  vinculo  situado  en  la  parte 
inferior  de  la  pagina. 
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Graficas  de  puntos 

De  un  clic  en  el  applet  del  capftulo  1  llamado  Construccion  de  una  grafica  de  pun¬ 
tos.  Si  el  usuario  mueve  el  cursor  sobre  el  applet  marcado  Dotplot  Demo,  vera  una 
lfnea  verde  con  un  valor  que  cambia  al  moverlo  a  lo  largo  del  eje  horizontal.  Cuando 
de  un  clic  con  el  boton  izquierdo  de  su  mouse,  aparecera  un  dato  en  ese  punto  de  la 
grafica  de  puntos.  Si  dos  medidas  son  identicas,  los  puntos  se  apilan  uno  encima  de 
otro  (figura  1.17).  Siga  las  instrucciones  del  Dotplot  Demo,  usando  los  datos  mues- 
trales  dados  ahf.  Si  se  equivoca,  el  applet  se  lo  indica.  El  segundo  applet  no  corregira 


FIGURA  1.17 

errores  y  el  usuario  puede  agregar  tantos  puntos  como  desee. 
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3.3 

Histogramas 

De  un  clic  en  el  applet  del  capftulo  1  llamado  Construccion  de  un  histograma.  Si 
se  desplaza  hacia  abajo,  al  applet  marcado  Histogram  Demo,  vera  las  fronteras  de 
intervalo  (o  puntos  medios  de  intervalo)  para  el  histograma  a  lo  largo  del  eje  horizon¬ 
tal.  Al  mover  el  apuntador  por  la  grafica,  una  caja  de  color  gris  claro  indicara  donde 
se  agrega  la  medicion  al  siguiente  clic  del  mouse.  Cuando  suelte  este,  la  caja  pasa  a 
color  azul  oscuro  (azul  oscuro  en  la  figura  1.18).  El  histograma  parcialmente  com- 
pleto  de  la  figura  1.18  contiene  un  3,  un  4,  un  5,  tres  6  y  un  7.  Siga  las  instrucciones 
del  Histogram  Demo  usando  los  datos  muestrales  dados  ahf.  De  un  clic  en  el  vinculo 
para  comparar  sus  resultados  contra  el  histograma  correcto.  El  segundo  applet  se 
usara  para  algunos  de  los  ejercicios  Mi  Applet. 

Haga  clic  en  el  applet  llamado  Flipping  Fair  Coins  y  desplace  el  apuntador  al 
applet  marcado  tamano  muestral  =  3.  La  computadora  recolectara  algunos  datos 
al  “virtualmente”  lanzar  al  aire  3  monedas  y  registrar  la  variable  discreta  cuantitativa 

x  =  numero  de  caras  observadas 

Haga  clic  en  “Nuevo  tiro  de  moneda”.  Vera  el  resultado  de  sus  tres  tiros  en  la  esquina 
superior  izquierda,  junto  con  el  valor  de  x.  Para  el  experimento  de  la  figura  1.19 
observamos  x  =  2. 

El  applet  empieza  a  construir  un  histograma  de  frecuencia  relativa  para  describir 
el  conjunto  de  datos,  que  en  este  punto  contiene  solo  una  observation.  Haga  clic  en 
“New  Coin  Flip”  (Nuevo  Tiro  de  Moneda)  unas  pocas  veces  mas.  Observe  las  mone- 
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FIGURA  1.18 
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FIGURA  1.19 
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FIGURA  1  .20 
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das,  junto  con  el  valor  de  x,  y  observe  como  crece  el  histograma  de  frecuencia  rela- 
tiva.  La  parte  roja  (azul  claro  en  las  figuras  1.19  y  1.20)  representa  los  datos  actuales 
agregados  al  histograma,  y  la  parte  azul  oscuro  de  la  figura  1 .20  esta  aportada  de  los 
tipos  previos  de  moneda.  El  usuario  puede  tirar  las  tres  monedas  10  veces  o  100  para 
generar  datos  con  mas  rapidez. 

La  figura  1 .20  muestra  el  histograma  de  frecuencia  relativa  para  500  observacio- 
nes  en  nuestro  conjunto  de  datos.  El  conjunto  de  datos  del  usuario  se  mostrara  un 
poco  diferente  pero  debe  tener  la  misma  forma  aproximada,  es  decir,  debe  ser  rela- 
tivamente  simetrico.  Para  nuestro  histograma,  podemos  decir  que  los  valores  x  =  0 
y  x  =  3  ocurrieron  alrededor  de  12-13%  del  tiempo,  mientras  que  los  valores  x  =  1  y 
x  =  2  ocurrieron  entre  38  y  40%  del  tiempo.  ^El  histograma  de  usted  produce  resul- 
tados  similares? 


Introduccion  a  MINITAB ™ 

MINITAB  es  un  paquete  de  software  que  presenta  numerosas  formas  para  diferentes 
ambientes  de  computadora.  La  version  actual  de  MINITAB  al  momento  de  imprimir  este 
texto  es  el  MINITAB  15,  que  se  usa  en  ambientes  Windows.  Supondremos  que  el  usuario 
esta  familiarizado  con  Windows;  si  no  es  asf,  quiza  una  asistente  de  ensenanza  pueda 
ayudarlo  a  dominar  los  aspectos  basicos. 

Una  vez  que  inicie  Windows,  hay  dos  formas  de  iniciar  MINITAB: 

•  Si  hay  un  icono  de  atajo  MINITAB  en  el  escritorio,  de  doble  clic  en  el  icono. 

•  Elaga  clic  en  el  boton  Start  de  la  barra  de  tareas.  Siga  los  menus,  seleccionando 

All  Programs  — >  MINITAB  Solutions  —>  MINITAB  15  Statistical  Software 
English.  Haga  clic  en  MINITAB  15  Statistical  Software  English  para  iniciar  el 
programa. 


Cuando  se  abra  el  MINITAB,  aparece  la  pantalla  principal  MINITAB  (vease  la  figura  1.21). 
Contiene  dos  ventanas:  la  ventana  Data  y  la  ventana  Session.  Un  clic  en  cualquier  parte 

FIGURA  1  .21 
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de  la  ventana  activa  a  esta  para  que  el  usuario  pueda  introducir  datos  o  teclear  comandos. 
Aun  cuando  es  posible  teclear  comandos  MINITAB  en  la  ventana  Session,  escogemos  usar 
el  metodo  Windows  por  ser  mas  conocido.  Si  prefiere  usar  comandos  con  tecleo,  consul- 
te  en  el  manual  MINITAB  las  instrucciones  detalladas. 

En  el  inciso  superior  de  la  ventana  Session  se  mostrara  la  barra  Menu.  Si  se  seleccio- 
na  y  hace  clic  en  cualquier  comando  de  la  barra  de  Menu,  aparece  un  menu  descendente, 
del  cual  usted  seleccionara  los  comandos  necesarios.  Usaremos  la  notacion  estandar  para 
indicar  una  secuencia  de  comandos  del  menu.  Por  ejemplo,  File  — »■  Open  Worksheet 
permitira  recuperar  una  “hoja  de  trabajo”,  es  decir,  un  conjunto  de  datos  de  la  ventana 
Data  que  el  usuario  ha  guardado  previamente.  Para  cerrar  el  programa,  la  secuencia  de 
comandos  es  File  —>  Exit. 

MINITAB  15  permite  guardar  numerosas  hojas  de  trabajo  como  “proyectos”.  Cuando 
el  usuario  trabaje  en  un  proyecto,  puede  agregar  nuevas  hojas  de  trabajo  o  abrir  hojas  de 
trabajo  de  otros  proyectos  para  agregar  a  su  proyecto  actual.  A  medida  que  se  familiarice 
mas  con  MINITAB,  podra  organizar  su  informacion  en  “hojas  de  trabajo”  o  en  “proyec¬ 
tos”,  dependiente  de  la  complejidad  de  su  trabajo. 

Graficas  con  MINITAB 

El  primer  conjunto  de  datos  a  ser  graficado  esta  formado  por  datos  cualitativos  cuyas 
frecuencias  ya  han  sido  registradas.  El  estatus  de  clase  de  105  estudiantes  de  un  curso 
introductorio  de  estadistica  se  muestra  en  la  tabla  1.13.  Antes  de  introducir  los  datos 
en  la  ventana  Minitab  Data,  inicie  un  proyecto  llamado  “capitulo  1”  al  dar  un  clic  en 
File  — >  New.  Aparece  un  cuadro  de  dialogo  llamado  “New”.  Haga  clic  en  Minitab  Pro¬ 
ject  y  en  OK.  Antes  de  continuar,  guardemos  este  proyecto  como  “capitulo  1”  usando 
la  serie  de  comandos  File  — >  Save  Project.  Teclee  Chapter  1  en  la  caja  File  Name  y 
seleccione  un  lugar  usando  la  caja  blanca  marcada  “Save  in:”  en  la  parte  superior  del 
cuadro  de  dialogo.  De  un  clic  en  Save.  En  la  ventana  Data  de  la  pantalla,  parte  superior, 
vera  el  nombre  de  su  nuevo  proyecto,  “Chapter  1  .MPJ”. 

tabla  i  13  Estatus  de  estudiantes  del  curso  de  estadistica 


Estatus 

1  er  ano 

Segundo  ano 

Penultimo  ano 

Ultimo  ano 

Graduado 

Frecuencia 

5 

23 

32 

35 

10 

Para  introducir  los  datos  en  la  hoja  de  trabajo,  de  un  clic  en  la  celda  gris  situada  abajo 
del  nombre  Cl  de  la  ventana  Data.  Puede  introducir  su  propio  nombre  descriptivo  para 
las  categories,  posiblemente  “Status”.  A  continuation  use  la  flecha  hacia  abajo  1  del 
mouse  para  continuar  por  la  columna  Cl,  introduciendo  las  cinco  descripciones  de  es¬ 
tatus.  Observe  que  el  nombre  Cl  ha  cambiado  a  Cl-T  porque  esta  usted  introduciendo 
texto  en  lugar  de  numeros.  Continue  dando  nombre  a  la  columna  2  (C2)  “Frecuency”,  e 
introduzca  las  cinco  frecuencias  numericas  en  C2.  La  ventana  de  datos  aparecera  como 
Frecuency  en  la  figura  1.22. 

Para  construir  una  grafica  de  pastel  para  estos  datos,  haga  clic  en  Graph  — »  Pie  Chart, 
y  aparecera  una  caja  de  dialogo  (vease  la  figura  1.23).  En  esta  caja,  el  usuario  debe 
especificar  la  forma  en  que  desee  crear  la  grafica.  De  un  clic  en  el  boton  de  radio  mar- 
cado  Chart  values  from  a  table.  Enseguida  coloque  su  cursor  en  la  caja  marcada  “Ca¬ 
tegorical  Variable”.  El  usuario  puede  (1)  dar  clic  en  Cl  en  la  lista  a  la  izquierda  y  esco- 
ger  Select,  (2)  dar  doble  clic  en  Cl  de  la  lista  a  la  izquierda,  o  (3)  teclear  Cl  en  la  caja 
“Categorical  variable”.  Del  mismo  modo,  ponga  el  cursor  en  la  caja  marcada  “Summary 
variables”  y  seleccione  C2.  De  un  clic  en  Labels  y  seleccione  la  ficha  marcada  Slice 
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FIGURA  1  .22 
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Labels.  Verifique  las  cajas  marcadas  “Category  names”  y  “Percent”.  Cuando  de  un  clic 
en  OK,  MINITAB creara  la  grafica  de  pastel  de  la  figura  1.24.  Hemos  removido  la  leyenda 
al  seleccionarla  y  eliminarla. 

Cuando  adquiera  mas  experiencia  en  el  uso  del  comando  de  graficas  de  pastel,  podra 
aprovechar  algunas  opciones  disponibles.  Una  vez  creada  la  grafica,  de  un  clic  derecho 
en  la  grafica  de  pastel  y  seleccione  Edit  Pie.  Puede  cambiar  los  colores  y  formato  de  la 
grafica,  “mostrar  por  separado”  sectores  importantes  del  pastel  y  cambiar  el  orden  de  las 
categorfas.  Si  el  usuario  da  un  clic  derecho  en  la  grafica  de  pastel  y  selecciona  Update 
Graph  Automatically,  la  grafica  de  pastel  se  actualizara  en  forma  automatica  cuando  se 
cambien  los  datos  de  las  columnas  Cl  y  C2  de  la  hoja  de  trabajo  MINITAB. 

Si  el  usuario  prefiere  construir  una  grafica  de  barras,  use  el  comando  Graph  — »  Bar 
Chart.  En  la  caja  de  Dialogo  que  aparece,  escoja  Simple.  Seleccione  una  opcion  de  la 
lista  descendente  “Bars  represent”,  dependiendo  de  la  forma  en  que  los  datos  se  hayan 
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FIGURA 


TABLA 


I  .24 


introducido  en  la  hoja  de  trabajo.  Para  los  datos  de  la  tabla  1.13,  escogimos  “Values 
from  a  table”  y  dimos  clic  en  OK.  Cuando  aparezca  la  caja  de  Dialog,  ponga  su  cursor 
en  la  caja  “Graph  variables”  y  seleccione  C2.  Ponga  su  cursor  en  la  caja  “Categorical 
variable”  y  seleccione  C 1 .  De  un  clic  en  OK  para  terminar  la  grafica  de  barras,  mostrada 
en  la  figura  1.25.  Una  vez  creada  la  grafica,  de  un  clic  derecho  en  las  diversas  partes  de 
la  grafica  de  barras  y  escoja  Edit  para  cambiar  el  aspecto  de  la  grafica. 

MINITAB  puede  crear  graficas  de  puntos,  graficas  de  tallo  y  hoja  e  histogramas  para 
datos  cuantitativos.  Las  40  acciones  superiores  del  mercado  secundario,  clasificadas  por 
el  porcentaje  de  acciones  en  circulacion  negociadas  en  un  dia  en  particular,  aparecen  en 
la  tabla  1.14.  Aun  cuando  podrfamos  simplemente  introducir  estos  datos  en  la  tercera 
columna  (C3)  de  la  Hoja  de  Trabajo  1  del  proyecto  “Chapter  1”,  iniciemos  una  nueva 
hoja  de  trabajo  dentro  de  “Chapter  1”  usando  File  —>  New,  dando  clic  en  Minitab  Wor¬ 
ksheet  y  dando  clic  en  OK.  La  Hoja  de  Trabajo  2  aparecera  en  la  pantalla.  Introduzca 
los  datos  en  la  columna  C 1  y  Pamelas  “Stocks”  (Acciones)  en  la  celda  gris  que  esta  un 
poco  abajo  de  Cl. 


14  Porcentaje  de  acciones  en  circulacion  negociadas 


11.88 

6.27 

5.49 

4.81 

4.40 

3.78 

3.44 

3.11 
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5.26 
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2.74 
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7.15 

5.98 

5.07 

4.55 

3.94 

3.62 

3.26 

2.99 

2.74 

2.62 

7.13 

5.91 

4.94 

4.43 

3.93 

3.48 

3.20 

2.89 

2.69 

2.61 

Para  crear  una  grafica  de  puntos,  use  Graph  — »  Dotplot.  En  la  caja  de  Dialog  que 
aparece,  escoja  One  Y  — »  Simple  y  de  un  clic  en  OK.  Para  crear  una  grafica  de  tallo  y 
hoja,  use  Graph  —>  Stem-and-Leaf.  Para  cualquiera  de  estas  graficas,  ponga  su  cursor 
en  la  caja  “Graph  variables”  y  seleccione  “Stocks”  (Acciones)  de  la  lista  a  la  izquierda 
(vease  la  figura  1.26). 
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FIGURA  1  .25 


FIGURA  1  .26 


El  usuario  puede  seleccionar  de  una  variedad  de  opciones  de  formato  antes  de  hacer 
clic  en  OK.  La  grafica  de  puntos  aparece  como  una  grafica,  en  tanto  que  la  grafica  de 
tallo  y  hoja  aparece  en  la  ventana  Session.  Para  imprimir  una  ventana  Graph  o  la  venta- 
na  Session,  de  un  clic  en  la  ventana  para  activarla  y  use  File  — >  Print  Graph  (o  Print 
Session  Window). 

Para  crear  un  histograma,  use  Graph  — >  Flistogram.  En  la  caja  de  Dialog  que  apa¬ 
rece,  escoja  Simple  y  de  un  clic  en  OK,  seleccionando  “Stocks”  para  la  caja  “Graph 
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Variables”.  Seleccione  Scale  — »  Y-Scale  Type  y  de  un  clic  en  el  boton  de  radio  marcado 
“Frequency”.  (Despues  puede  editar  el  histograma  para  mostrar  frecuencias  relativas.) 
De  doble  clic  en  OK.  Una  vez  creado  el  histograma,  cle  un  clic  derecho  en  el  eje  Y  y 
seleccione  Edit  Y  Scale.  Bajo  la  ficha  marcada  “Scale”,  el  usuario  puede  dar  clic  en  el 
boton  de  radio  marcado  “Position  of  ticks”  y  teclear  0  5  10  15.  A  continuacion  de  un 
clic  en  la  ficha  marcada  “Labels”  (Leyendas),  en  el  boton  de  radio  marcado  “Specified” 
y  teclee  0  5/40  10/40  15/40.  Haga  clic  en  OK.  Esto  reducira  el  numero  de  “palomas”  en 
el  eje  y  y  las  cambia  a  frecuencias  relativas.  Por  ultimo,  de  doble  clic  en  la  palabra  “Fre¬ 
quency”  junto  al  eje  y.  Cambie  la  caja  marcada  “Text”  para  leer  “Relative  frequency”  y 
de  clic  en  OK. 

Para  ajustar  el  tipo  de  fronteras  para  el  histograma,  de  un  clic  derecho  en  las  barras 
del  histograma  y  escoja  Edit  Bars.  Use  la  ficha  marcada  “Binning”  para  escoger  ya  sea 
“Cutpoints”  (Puntos  de  corte)  o  “Midpoints”  (Puntos  medios)  para  el  histograma;  puede 
usted  cambiar  los  colores,  llenar  el  tipo  y  estilo  de  fuente  del  histograma.  Si  da  un  clic 
derecho  en  las  barras  y  selecciona  Update  Graph  Automatically,  el  histograma  se  ac- 
tualiza  en  forma  automatica  cuando  se  cambien  los  datos  de  la  columna  “Stocks”. 

Cuando  el  usuario  se  familiarice  con  el  MINITAB  para  Windows,  podra  explorar  las 
diversas  opciones  disponibles  para  cada  tipo  de  grafica.  Es  posible  graficar  mas  de  una 
variable  a  la  vez,  cambiar  los  ejes,  escoger  los  colores  y  modificar  graficas  en  numerosas 
formas.  No  obstante,  aun  con  los  comandos  basicos  predeterminados,  es  evidente  que  la 
distribucion  de  acciones  en  circulacion  esta  muy  sesgada  a  la  derecha. 

Asegurese  de  guardar  su  trabajo  usando  el  comando  File  — >  Save  Project  antes  de 
salir  del  MINITAB. 


FIGURA  1  .27 _ _ 

■  :  _ 


Histogram  of  Storks 
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EJercicios  suplementarios 

1 .38  iCuantitativa  o  cualitativa?  Identifique  cada 
variable  como  cuantitativa  o  cualitativa: 

a.  Origen  etnico  de  un  candidato  a  un  cargo  publico 

b.  Calificacion  (0-100)  en  un  examen  de  conocimientos 

c.  Establecimiento  de  comida  rapida  preferida 
por  un  estudiante  (McDonald’s,  Burger  King  o 
Carl’s  Jr.) 

d.  Concentracion  de  mercurio  en  una  muestra  de  atun 

1 .39  ^Simetrica  o  sesgada?  ^Espera  usted  que  las 
distribuciones  de  las  variables  siguientes  sean  simetricas 
o  sesgadas?  Explique. 

a.  Monto  en  dolares  de  prestamos  no  asegurados 

b.  Monto  en  dolares  de  prestamos  asegurados 

c.  Precio  de  una  lata  de  8  onzas  (%  kg)  de  chfcharos 

d.  Estatura  en  pulgadas  de  mujeres  de  primer  ano  en  la 
universidad 

e.  Numero  de  envolturas  de  taco  rotas  en  un  paquete  de 
100  envolturas 

f.  Numero  de  garrapatas  halladas  en  cada  uno  de  50 
conejos  de  cola  de  algodon  atrapados 

1 .40  <(Continuas  o  discretas?  Identifique  cada 
variable  como  continua  o  discreta: 

a.  Numero  de  homicidios  en  Detroit  en  el  periodo  de 
un  mes 

b.  Lapso  entre  llegadas  de  un  paciente  externo  a  una 
clfnica 

c.  Numero  de  errores  de  tipograffa  en  una  pagina  de 
manuscrito 

d.  Numero  de  focos  defectuosos  en  un  paquete  que 
contiene  cuatro  focos 

e.  Tiempo  necesario  para  terminar  un  examen 

1.41  Continuas  o  discretas,  otra  vez  Identifique 
cada  variable  como  continua  o  discreta: 

a.  Peso  de  dos  docenas  de  camarones 

b.  Temperatura  corporal  de  una  persona 

c.  Numero  de  personas  en  espera  de  tratamiento  en  la 
sala  de  emergencia  de  un  hospital 

d.  Numero  de  propiedades  a  la  venta  de  una  agenda  de 
bienes  raices 

e.  Numero  de  reclamaciones  recibidas  por  una  compafua 
de  seguros  en  un  dfa 

1.42  Continua  o  discreta,  otra  vez  Identifique  cada 
variable  como  continua  o  discreta: 


a.  Numero  de  personas  en  fila  de  espera  en  la  caja  de 
pago  de  un  supermercado 

b.  Profundidad  de  una  nevada 

c.  Tiempo  para  que  un  conductor  responda  ante  un 
choque  inminente 

d.  Numero  de  aviones  que  llegan  al  aeropuerto  de 
Atlanta  en  una  hora  determinada 

datos  1.43  Agua  corriente  Se  ha  sugerido  agua 
corriente  como  metodo  de  acondicionamiento 
cardiovascular  para  atletas  lesionados  y  otros  que  deseen 
un  programa  de  aerobics  de  bajo  impacto.  Un  estudio 
publicado  en  la  Journal  of  Sports  Medicine  investigo  la 
relation  entre  la  cadencia  de  ejercicio  y  la  frecuencia 
cardiaca,  al  medir  las  frecuencias  cardiacas  de  20 
voluntarios  sanos  a  una  cadencia  de  48  ciclos  por  minuto 
(un  ciclo  formado  por  dos  pasos).10  Los  datos  aparecen  a 
continuacion: 

87  109  79  80  96  95  90  92  96  98 

101  91  78  112  94  98  94  107  81  96 

Construya  una  grafica  de  tallo  y  hoja  para  describir  los 
datos.  Analice  las  caracterfsticas  de  la  distribution 
de  datos. 

(^}datos  1.44  Lagos  mas  grandes  del  mundo  Un 

lago  es  un  cuerpo  de  agua  rodeado  por  tierra. 
Por  lo  tanto,  algunos  cuerpos  de  agua  llamados  “mares”, 
como  el  mar  Caspio,  en  realidad  son  lagos  salados. 

En  la  tabla  siguiente,  la  longitud  en  millas  aparece  para 
los  lagos  naturales  mas  grandes  del  mundo,  excluyendo 
el  mar  Caspio,  que  tiene  un  area  de  143244  millas 
cuadradas,  una  longitud  de  760  millas  y  una  profundidad 
maxima  de  3363  pies.5 


Nombre 

Longitud  (millas) 

Nombre 

Longitud  (millas) 

Superior 

350 

Eyre 

90 

Victoria 

250 

Titicaca 

122 

Huron 

206 

Nicaragua 

102 

Michigan 

307 

Athabasca 

208 

Aral  Sea 

260 

Reindeer 

143 

Tanganyika 

420 

Turkana 

154 

Baykal 

395 

Issyk  Kul 

115 

Great  Bear 

192 

Torrens 

130 

Nyasa 

360 

Vanern 

91 

Great  Slave 

298 

Nettilling 

67 

Erie 

241 

Winnipegosis 

141 

Winnipeg 

266 

Albert 

100 

Ontario 

193 

Nipigon 

72 

Balkhash 

376 

Gairdner 

90 

ladoga 

124 

Urmia 

90 

Maracaibo 

133 

Manitoba 

140 

Onega 

145 

Chad 

175 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 
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a.  Use  una  grafica  de  tallo  y  hoja  para  describir  las 
longitudes  de  los  lagos  mas  grandes  del  mundo. 

b.  Use  un  histograma  para  exhibir  estos  mismos  datos. 
/Como  se  compara  con  la  grafica  de  tallo  y  hoja  del 
inciso  a)? 

c.  /Estos  datos  son  simetricos  o  sesgados?  Si  son 
sesgados,  /cual  es  la  direccion  del  sesgo? 

(^j  datos  1.45  Edades  de  centavos  Recolectamos 
50  monedas  de  un  centavo  y  registramos  sus 
edades,  al  calcular  ED  AD  =  ANO  ACTUAL  -  ANO 
EN  EL  CENTAVO. 


5 

1 

9 

1 

2 

20 

0 

25 

0 

17 

1 

4 

4 

3 

0 

25 

3 

3 

8 

28 

5 

21 

19 

9 

0 

5 

0 

2 

1 

0 

0 

1 

19 

0 

2 

0 

20 

16 

22 

10 

19 

36 

23 

0 

1 

17 

6 

0 

5 

0 

a.  Antes  de  trazar  grafica  alguna,  trate  de  visualizar 
el  aspecto  que  tendra  la  distribucion  de  edades  de 
centavos.  /Tendra  forma  de  montfculo,  sera  simetrica, 
estara  sesgada  a  la  derecha  o  sesgada  a  la  izquierda? 

b.  Trace  un  histograma  de  frecuencia  relativa  para 
describir  la  distribucion  de  edades  de  centavos. 
/Como  describirfa  usted  la  forma  de  la  distribucion? 

(^)datos  1.46  Edades  de  centavos,  continua 

Los  datos  que  aparecen  a  continuation 
representan  las  edades  de  un  conjunto  diferente  de  50 
centavos,  de  nuevo  calculados  usando  ED  AD  =  ANO 
ACTUAL  -  ANO  EN  EL  CENTAVO. 


41 

9 

0 

4 

3 

0 

3 

8 

21 

3 

2 

10 

4 

0 

14 

0 

25 

12 

24 

19 

3 

1 

14 

7 

2 

4 

4 

5 

1 

20 

14 

9 

3 

5 

3 

0 

8 

17 

16 

0 

0 

7 

3 

5 

23 

7 

28 

17 

9 

2 

a.  Trace  un  histograma  de  frecuencia  relativa  para 
describir  la  distribucion  de  edades  de  centavos. 
/  La  forma  es  similar  a  la  del  histograma  de 
frecuencia  relativa  del  ejercicio  1.41? 


b.  Trace  una  grafica  de  tallo  y  hoja  para  describir 
las  edades  de  centavos.  /Hay  algunas  medidas 
anormalmente  grandes  o  pequenas  en  el  conjunto? 


EX0147 


1 .47  Vetos  presidenciales  A  continuacion 
aparece  una  lista  de  los  43  presidentes  de 


Estados  Unidos,  junto  con  el  numero  de  vetos  regulares 
empleados  por  cada  uno  de  ellos:5 


Washington 

2 

B.  Harrison 

19 

J.  Adams 

0 

Cleveland 

42 

Jefferson 

0 

McKinley 

6 

Madison 

5 

T.  Roosevelt 

42 

Monroe 

1 

Taft 

30 

J.  Q.  Adams 

0 

Wilson 

33 

Jackson 

5 

Harding 

5 

Van  Buren 

0 

Coolidge 

20 

W.  H.  Harrison 

0 

Hoover 

21 

Tyler 

6 

F.  D.  Roosevelt 

372 

Polk 

2 

Truman 

180 

Taylor 

0 

Eisenhower 

73 

Fillmore 

0 

Kennedy 

12 

Pierce 

9 

L.  Johnson 

16 

Buchanan 

4 

Nixon 

26 

Lincoln 

2 

Ford 

48 

A.  Johnson 

21 

Carter 

13 

Grant 

45 

Reagan 

39 

Hayes 

12 

G.  H.  W.  Bush 

29 

Garfield 

0 

Clinton 

36 

Arthur 

4 

G.W.  Bush 

1 

Cleveland 

304 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 


Use  una  grafica  apropiada  para  describir  el  numero  de 
vetos  emitidos  por  los  43  presidentes.  Escriba  un  parrafo 
de  resumen  que  describa  este  conjunto  de  datos. 

(^)  datos  1.48  Ciudades  ventosas  /Hay  algunas 
ciudades  mas  ventosas  que  otras?  /Chicago 
merece  el  apodo  de  “La  Ciudad  de  los  Vientos”?  Estos  datos 
son  las  velocidades  promedio  del  viento  (en  millas  por  hora) 
para  55  ciudades  seleccionadas  en  Estados  Unidos:5 


8.9 

12.4 

12.9 

8.4 

7.8 

11.5 

8.2 

9.0 

CO 

CO 

7.1 

11.8 

10.3 

7.7 

9.2 

10.5 

9.3 

8.7 

8.7 

9.1 

9.0 

10.5 

11.3 

7.8 

CO 

oo 

12.2 

7.9 

CO 

CO 

CO 

CO 

10.8 

8.7 

7.6 

5.5 

35.1 

10.5 

10.4 

11.0 

10.2 

8.6 

10.7 

9.6 

8.3 

8.0 

9.5 

7.7 

9.4 

8.7 

5.8 

10.2 

6.9 

9.2 

10.2 

6.2 

9.6 

12.2 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 


a.  Construya  un  histograma  de  frecuencia  relativa  para 
los  datos.  (sugerencia:  Escoja  las  fronteras  de  clase 
sin  incluir  el  valor  x  =  35.1  en  el  rango  de  valores.) 

b.  El  valor  x  =  35.1  se  registro  en  Monte  Washington, 
New  Hampshire.  /La  geograffa  de  esa  ciudad  explica 
la  observation? 

c.  El  promedio  de  velocidad  del  viento  en  Chicago  esta 
registrado  en  10.3  millas  por  hora.  /Considera  usted 
que  esto  es  extraordinariamente  ventoso? 

datos  1.49  Kentucky  Derby  El  siguiente  conjunto 
de  datos  muestra  los  tiempos  ganadores  (en 
segundos)  para  las  carreras  del  Derby  de  Kentucky  de 
1950  a  2007:11 


(1950) 

121.3 

122.3 

121.3 

122.0 

123.0 

121.4 

123.2 

122.1 

125.0 

122.1 

(1960) 

122.2 

124.0 

120.2 

121.4 

120.0 

121.1 

122.0 

120.3 

122.1 

121.4 

(1970) 

123.2 

123.1 

121.4 

119.2' 

124.0 

122.0 

121.3 

122.1 

121.1 

122.2 

(1980) 

122.0 

122.0 

122.2 

122.1 

122.2 

120.1 

122.4 

123.2 

122.2 

125.0 

(1990) 

122.0 

123.0 

123.0 

122.2 

123.3 

121.1 

121.0 

122.4 

122.2 

123.2 

(2000) 

121.0 

119.97 

121.13 

121.19 

124.06 

122.75 

121.36 

122.17 

'Tiempo  record  establecido  por  Secretariat  en  1973 
Fuente:  www.kentuckyderby.com 


a.  /Piensa  usted  que  con  los  anos  habra  una  tendencia  en 
los  tiempos  ganadores?  Trace  una  grafica  de  lfnea  para 
verificar  su  respuesta. 

b.  Describa  la  distribucion  de  tiempos  ganadores  usando 
una  grafica  apropiada.  Comente  sobre  la  forma  de  la 
distribucion  y  busque  algunas  observaciones  poco 
comunes. 


www.FreeLibros.me 


EJERCICIOS  SUPLEMENTARIOS  O  45 


datos  1.50  Redes  computarizadas  en  casa 

A  medida  que  los  norteamericanos  esten 
mas  informados  acerca  del  hardware  y  el  software  de 
computadoras,  los  precios  bajen  y  la  instalacion  se  haga 
mas  facil,  se  espera  que  las  redes  de  las  PC  en  casa 
penetren  al  27%  de  hogares  en  Estados  Unidos  hacia  el 
ano  2008,  con  la  tecnologfa  inalambrica  a  la  delantera.12 

Redes  domesticas  en  Estados  Unidos  (en  millones) 

Ano  Conectada  Inalambrica 


2002 

6.1 

1.7 

2003 

6.5 

4.5 

2004 

6.2 

8.7 

2005 

5.7 

13.7 

2006 

4.9 

19.1 

2007 

4.1 

24.0 

2008 

3.4 

28.2 

Fuente:  Jupiter  Research 

a.  ^Que  metodos  graficos  podrfa  usted  usar  para  describir 
los  datos? 

b.  Antes  de  trazar  una  grafica,  busque  en  la  tabla  el  numero 
pronosticado  de  instalaciones  conectadas  e  inalambricas. 
^Que  tendencias  espera  ver  en  las  graficas? 

c.  Use  una  grafica  de  lrnea  para  describir  el  numero 
pronosticado  de  instalaciones  domesticas  alambricas 
para  los  anos  2002  a  2008. 

d.  Use  una  grafica  de  lrnea  para  describir  el  numero 
pronosticado  de  instalaciones  domesticas  inalambricas 
para  los  anos  2002  a  2008. 

datos  1.51  Resultados  de  elecciones  Las 

elecciones  de  2004  fueron  una  carrera  en  la 
que  el  titular,  George  W.  Bush,  derroto  a  John  Kerry, 
Ralph  Nader  y  otros  candidatos,  recibiendo  50.7%  de  la 
votacion.  El  voto  popular  (en  miles)  para  George  W.  Bush 
en  cada  uno  de  los  50  estados  aparece  a  continuacion:8 


AL 

1176 

HI 

194 

MA 

1071 

NM 

377 

SD 

233 

AK 

191 

ID 

409 

Ml 

2314 

NY 

2962 

TN 

1384 

AZ 

1104 

IL 

2346 

MN 

1347 

NC 

1961 

TX 

4527 

AR 

573 

IN 

1479 

MS 

685 

ND 

r--« 

CD 

UT 

664 

CA 

5510 

IA 

572 

M0 

1456 

OH 

2860 

VT 

121 

CO 

1101 

KS 

736 

MT 

266 

OK 

960 

VA 

1717 

CT 

694 

KY 

1069 

NE 

513 

OR 

867 

WA 

1305 

DE 

172 

LA 

1102 

NV 

419 

PA 

2794 

WV 

424 

FL 

3965 

ME 

330 

NH 

331 

Rl 

169 

Wl 

1478 

GA 

1914 

MD 

1025 

NJ 

1670 

SC 

938 

WY 

168 

a.  Con  solo  mirar  la  tabla,  /  t|iie  forma  piensa  usted  que 
tendra  la  distribucion  de  datos  para  el  voto  popular  por 
estado? 

b.  Trace  un  histograma  de  frecuencia  relativa  para 
describir  la  distribucion  del  voto  popular  para  el 
presidente  Bush  en  los  50  estados. 

c.  ^E1  histograma  del  inciso  b)  confirma  el  calculo 
de  usted  en  el  inciso  a)?  H ay  resultados  atfpicos? 
^Como  puede  explicarlos? 


datos  1.52  Resultados  de  elecciones, 

continua  Consulte  el  ejercicio  1.51.  A 
continuacion  aparece  el  porcentaje  del  voto  popular 
recibido  por  el  presidente  Bush  en  cada  uno  de  los  50 
estados:8 


AL 

62 

HI 

45 

MA 

37 

NM 

50 

SD 

60 

AK 

61 

ID 

68 

Ml 

48 

NY 

40 

TN 

57 

AZ 

55 

IL 

44 

MN 

48 

NC 

56 

TX 

61 

AR 

54 

IN 

60 

MS 

59 

ND 

63 

UT 

73 

CA 

44 

IA 

50 

M0 

53 

OH 

51 

VT 

39 

CO 

52 

KS 

62 

MT 

59 

OK 

66 

VA 

54 

CT 

44 

KY 

60 

NE 

66 

OR 

47 

WA 

46 

DE 

46 

LA 

57 

NV 

51 

PA 

48 

WV 

56 

FL 

52 

ME 

45 

NH 

49 

Rl 

39 

Wl 

49 

GA 

58 

MD 

43 

NJ 

46 

SC 

58 

WY 

69 

a.  Con  solo  mirar  la  tabla,  ^que  forma  piensa  usted  que 
tendra  la  distribucion  de  datos  para  el  porcentaje  del 
voto  popular? 

b.  Trace  un  histograma  de  frecuencia  relativa  para 
describir  la  distribucion.  Describa  la  forma  de  la 
distribucion  y  busque  resultados  atfpicos.  /,La  grafica 
confirma  su  respuesta  al  inciso  a)? 

1 .53  Resultados  de  elecciones,  continua  Consulte 
los  ejercicios  1.51  y  1.52.  Las  siguientes  graficas  de 
tallo  y  hoja  fueron  generadas  usando  el  MINITAB  para 
las  variables  llamadas  “Voto  popular”  y  "Porcentaje  de 
Votos”. 

Pantalla  de  tallo  y  hoja:  Voto  popular 
y  porcentaje  de  votos 


Stem- 

-and-leaf  of 

Stem- 

-and-leaf  of 

Popular  Vote  N  =  50 

Percent  Vote  N  =  5 

Leaf 

Unit  =  100 

Leaf 

Unit  =1.0 

7 

0  1111111 

3 

3  799 

12 

0  22333 

8 

4  03444 

18 

0  444555 

19 

4  55666788899 

22 

0  6667 

(9) 

5  001122344 

25 

0  899 

22 

5  566778899 

25 

1  0001111 

13 

6  00011223 

18 

1  333 

5 

6  6689 

15 

1  444 

1 

7  3 

12 

1  67 

10 

1  99 

8 

2 

8 

2  33 

6 

2 

6 

2  7 

5 

2  89 

HI  39,  45,  55 


a.  Describa  las  formas  de  las  dos  distribuciones.  ^Hay 
resultados  atfpicos? 

b.  ('.Las  graficas  de  tallo  y  hoja  se  asemejan  a  los 
histogramas  de  frecuencia  relativa  construidos  en 
los  ejercicios  1.51  y  1.52? 

c.  Explique  por  que  la  distribucion  del  voto  popular  para 
el  presidente  Bush  por  estado  esta  sesgada,  en  tanto 
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que  el  porcentaje  de  votos  populares  por  estado 
tiene  forma  de  montfculo. 

(^)datos  1.54  Estaturas  de  estudiantes  Las  estaturas 
exo 1 54  de  105  estudiantes  de  un  grupo  de  bioestadfstica, 
indicadas  voluntariamente,  estan  descritas  en  el 
histograma  de  frecuencia  relativa  siguiente. 


a.  Describa  la  forma  de  la  distribucion. 

b.  ^Ve  alguna  caracterfstica  poco  comtin  en  este 
histograma? 

c.  ^Puede  considerar  una  explication  para  los  dos  picos 
del  histograma?  (',Hay  algun  otro  factor  que  este 
causando  que  las  estaturas  formen  un  montfculo  en 
dos  picos  separados?  f,Que  es? 

(^) datos  1.55  Temor  al  terrorismo  Numerosas 

encuestas  de  opinion  han  dado  seguimiento  a 
puntos  de  vista  respecto  al  temor  a  ataques  terroristas 
despues  del  1 1  de  septiembre  de  2001  al  Centro 
Mundial  de  Comercio.  Una  encuesta  del  Newsweek 
realizada  por  Princeton  Survey  Research  Associates 
International  presento  los  resultados  de  varias  encuestas 
en  un  periodo  de  dos  anos  que  preguntaba:  “^Aprueba  o 
desaprueba  usted  el  modo  en  que  Bush  esta  manejando  el 
terrorismo  y  la  seguridad  nacional?”  Los  datos  aparecen 
en  la  tabla  siguiente:13 


Fecha  %  aprueba  %  desaprueba  %  que  no  sabe 


8/10-11/06 

55 

40 

5 

5/11-12/06 

44 

50 

6 

3/16-17/06 

44 

50 

6 

11/10-11/05 

45 

49 

6 

9/29-30/05 

51 

44 

5 

9/8-9/05 

46 

48 

6 

8/2-4/05 

51 

41 

8 

3/17-18/05 

57 

35 

8 

4/8-9/04 

59 

35 

6 

3/25-26/04 

57 

38 

5 

2/19-20/04 

65 

28 

7 

a.  Trace  una  grafica  de  lfnea  para  describir  el  porcentaji 

que  aprueba  el  manejo  que  hace  Bush  del  terrorismo 

y  seguridad  nacional.  Use  el  tiempo  como  eje 
horizontal. 

b.  Coloque  encima  otra  grafica  de  lfnea  sobre  la  trazada 
en  el  inciso  a)  para  describir  el  porcentaje  que  no 
aprueba. 

c.  La  siguiente  grafica  de  lfnea  fue  creada  usando  el 
MINITAB.  yDihere  de  la  grafica  que  usted  trazo?  Use  la 
grafica  de  lfnea  para  resumir  cambios  en  las  encuestas, 
poco  despues  de  los  ataques  terroristas  en  Espana  el  1 1 
de  marzo  de  2004,  y  en  Inglaterra  en  julio  de  2005. 

d.  Un  complot  para  derribar  aviones  en  vuelos  de 
Inglaterra  a  Estados  Unidos  fue  frustrado  por  agentes 
secretos  ingleses  y  el  arresto  de  12  sospechosos  siguio 
el  9  de  agosto  de  2006.  Resuma  cualesquier  cambios 
en  porcentaje  de  aprobacion  que  puedan  haber  sido 
causados  despues  de  los  arrestos  del  9  de  agosto. 


(^)datos  1.56  Frecuencia  del  pulso  Un  grupo 
de  50  estudiantes  de  biomedicina  tomaron 
la  frecuencia  de  sus  pulsos,  al  contar  el  numero  de 
pulsaciones  durante  30  segundos  y  luego  multiplicando 
por  2. 


80 

70 

88 

70 

84 

66 

84 

82 

66 

42 

52 

72 

90 

70 

96 

84 

96 

86 

62 

78 

60 

82 

88 

54 

66 

66 

80 

88 

56 

104 

84 

84 

60 

84 

88 

58 

72 

84 

68 

74 

84 

72 

62 

90 

72 

84 

72 

110 

100 

58 

a.  (,Por  que  son  pares  todos  los  numeros  de  las 
mediciones? 

b.  Trace  una  grafica  de  tallo  y  hoja  para  describir  los 
datos,  dividiendo  cada  tallo  en  dos  lfneas. 

c.  Construya  un  histograma  de  frecuencia  relativa  para 
los  datos. 

d.  Escriba  un  parrafo  corto  que  describa  la  distribucion 
de  las  frecuencias  de  pulsos  de  los  estudiantes. 

1.57  Internet  movil  El  internet  movil  esta  creciendo, 
con  usuarios  teniendo  acceso  a  sitios  como  Yahoo!  Mail, 
the  Weather  Channel,  ESPN,  Google,  Hotmail 
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y  Mapquest  desde  sus  telefonos  celulares.  Los 
buscadores  mas  conocidos  en  la  web  se  muestran  en 
la  tabla  siguiente,  junto  con  el  porcentaje  de  la  parte 
de  mercado  de  cada  uno.14 

Parte  de  Parte  de 


Buscador  mercado  Buscador  mercado 


Openwave 

27% 

Teleca  All 

6% 

Motorola 

24% 

Sony  Ericsson 

5% 

Nokia 

13% 

RIM 

5% 

Access  Net  Front 

9% 

Blazer 

4% 

Fuente:  www.clickz.com 


a.  i,Los  porcentajes  suman  100%?  Si  no  es  asf,  genere 
una  categorfa  llamada  “Otros”  para  considerar  los 
porcentajes  faltantes. 

b.  Use  una  grafica  de  pastel  para  describir  las  partes  de 
mercado  para  los  diversos  buscadores  moviles  de  la 
web. 


(^)datos  1.58  iCuanto  puede  ahorrar?  Un  anuncio 
en  una  revista  Times  reciente  decfa  que  Geico 
Insurance  ayudarfa  a  ahorrar  un  promedio  de  $200 
dolares  por  ano  en  seguro  de  automoviles.15 


a.  Construya  un  histograma  de  frecuencia  relativa 
para  describir  el  promedio  de  ahorros  para  los  27 
estados  mostrados  en  el  mapa  de  Estados  Unidos. 
y,Ve  usted  algunas  caracterfsticas  poco  comunes  en  el 
histograma? 

b.  Construya  una  grafica  de  tallo  y  hoja  para  los  datos 
dados  por  Geico  Insurance. 

c.  y,Como  cree  usted  que  Geico  selecciono  los  27  estados 
para  incluirlos  en  este  anuncio? 

(^)datos  1.59  Un  hallazgo  arqueologico  Un  artfculo 
en  Archaeometry  contem'a  un  analisis  de  26 
muestras  de  alfareria  romano-britanica,  hallada  en  cuatro 
sitios  de  homos  en  el  Reino  Unido.16  Las  muestras  fueron 
analizadas  para  determinar  su  composicion  qufmica,  con 
el  porcentaje  de  oxido  de  aluminio  de  cada  una  de  las  26 
muestras  presentadas  en  la  tabla  siguiente. 


Llanederyn 

Caldicot 

Island  Thorns 

Ashley  Rails 

14.4 

11.6 

11.8 

18.3 

17.7 

13.8 

11.1 

11.6 

15.8 

18.3 

14.6 

13.4 

18.0 

16.7 

11.5 

12.4 

18.0 

14.8 

13.8 

13.1 

20.8 

19.1 

10.9 

12.7 

10.1 

12.5 

a.  Construya  un  histograma  de  frecuencia  relativa  para 
describir  el  contenido  de  oxido  de  aluminio  en  las  26 
muestras. 

b.  (iQue  caracterfstica  poco  comun  observa  usted  en  esta 
grafica?  ^Puede  considerar  una  explicacion  de  esta 
caracterfstica? 

c.  Trace  una  grafica  de  puntos  para  los  datos,  usando 
una  letra  (L,  C,  I  o  A)  para  localizar  el  punto  de  datos 
en  la  escala  horizontal.  ^Ayuda  esto  a  explicar  la 
caracterfstica  poco  comun  del  inciso  b)? 

1 .60  El  gran  debate  de  calorias  ^Quiere  hajar  de 
peso?  Puede  hacerlo  si  reduce  sus  calorias,  mientras 
tome  suficiente  valor  nutricional  de  los  alimentos  que 
consuma.  A  continuacion  tenemos  una  representacion 
visual  del  numero  de  calorias,  en  algunos  de  los 
alimentos  favoritos  de  los  estadounidenses,  adaptada  de 
un  artfculo  de  The  Press-Enterprise.11 


Numero  de  calorias 


m 


26 

53 

140 

145 

330 

Kiss  de 

Galleta 

lata  de 

cerveza 

rebanada  grande 

Hershey 

Oreo 

Coca-Cola 
350  ml 

Budweiser 
de  350  ml 

de  pizza 

Papa  John’s 
de  pepperoni 

800 

hamburguesa 
Burger  King 
grande  con  queso 


a.  Comente  sobre  la  precision  de  la  grafica  mostrada 
arriba.  <^Los  tamanos,  alturas  y  volumenes  de  los 
seis  artfculos  representan  con  precision  el  numero  de 
calorias  en  el  artfculo? 

b.  Trace  una  grafica  de  barras  real  para  describir  el 
numero  de  calorias  en  estos  seis  alimentos  favoritos. 

datos  1.61  Laptops  y  aprendizaje  Un  experimento 
informal  fue  realizado  por  la  secundaria  McNair 
Academic  de  Jersey  City,  Nueva  Jersey,  para  investigar 
el  uso  de  computadoras  portables  como  herramienta  de 
aprendizaje  en  el  estudio  del  algebra.18  Un  grupo  de  20 
estudiantes  de  primer  ano  recibio  estas  computadoras 
para  usar  en  la  escuela  y  en  casa,  al  tiempo  que  a  otro 
grupo  de  27  no  se  les  dieron  laptops;  no  obstante,  muchos 
de  estos  podfan  usarlas  en  casa.  Las  calificaciones 
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de  examen  final  para  los  dos  grupos  se  muestran  a 
continuacion. 


Con  laptops 

Sin  laptops 

98 

84 

63 

83 

97 

97 

93 

93 

52 

74 

88 

57 

83 

63 

88 

100 

84 

86 

81 

84 

100 

81 

99 

91 

49 

78 

83 

80 

81 

89 

68 

84 

78 

29 

64 

47 

93 

74 

72 

89 

90 

57 

67 

89 

70 

94 

83 

Los  histogramas  que  se  muestran  a  continuacion 
muestran  la  distribucion  de  calificaciones  del  examen 
final  para  los  dos  grupos. 


@gj datos  1.63  Impuesto  a  la  gasolina  Las  siguientes 
son  tasas  de  impuesto  estatal  a  la  gasolina  en 
2006,  en  centavos  por  galon,  para  los  50  estados  y  el 
distrito  de  Columbia.5 


AL 

18.0 

HI 

16.0 

MA 

21.0 

NM 

17.0 

SD 

20.0 

AK 

8.0 

ID 

25.0 

Ml 

19.0 

NY 

23.9 

TN 

20.0 

AZ 

18.0 

IL 

19.0 

MN 

20.0 

NC 

29.9 

TX 

20.0 

AR 

20.0 

IN 

18.0 

MS 

18.0 

ND 

23.0 

UT 

24.5 

CA 

18.0 

IA 

21.0 

M0 

17.0 

OH 

28.0 

VT 

19.0 

CO 

22.0 

KS 

24.0 

MT 

27.0 

OK 

20.0 

VA 

17.5 

CT 

25.0 

KY 

19.0 

NE 

26.1 

OR 

24.0 

WA 

31.0 

DE 

23.0 

LA 

20.0 

NV 

23.0 

PA 

32.0 

WV 

20.5 

DC 

20.0 

ME 

25.9 

NH 

18.0 

Rl 

30.0 

Wl 

32.9 

FL 

14.9 

MD 

23.5 

NJ 

10.5 

SC 

16.0 

WY 

14.0 

GA 

10.0 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 


a.  Construya  una  grafica  de  tallo  y  hoja  para  los  datos. 

b.  7,  Como  describirfa  la  forma  de  esta  distribucion? 

c.  7,  Hay  estados  con  impuesto  a  la  gasolina 
extraordinariamente  bajo  o  alto?  Si  es  asf,  ^cuales  son 
esos  estados? 

(^)datos  1.64  Plantas  hidroelectricas  Los  datos 
siguientes  representan  capacidades  estimadas 
en  megawatts  (millones  de  watts)  para  las  20  plantas 
hidroelectricas  mas  grandes  del  mundo.5 


18200 

4500 

3000 

14000 

4200 

2940 

10000 

4200 

2715 

8370 

3840 

2700 

6400 

3230 

2541 

6300 

3300 

2512 

6000 

3100 

Escriba  un  parrafo  con  un  resumen  que  describa  y 
compare  la  distribucion  de  calificaciones  del  examen 
final  para  los  dos  grupos  de  estudiantes. 

datos  1 .62  ]  Old  Faithfu  Los  datos  siguientes  son 

los  tiempos  de  espera  entre  erupciones  del  geiser 
llamado  Old  Faithful  (Viejo  Fiel)  del  parque  nacional 
Yellowstone.19  Use  uno  de  los  metodos  graficos  de  este 
capftulo  para  describir  la  distribucion  de  tiempos  de 
espera.  Si  hay  algunas  caracterfsticas  poco  comunes  en 
su  grafica,  vea  si  puede  idear  alguna  explication  practica 
de  ellas. 


56 

89 

51 

79 

58 

82 

52 

88 

52 

78 

69 

75 

77 

53 

80 

54 

79 

74 

65 

78 

55 

87 

53 

85 

61 

93 

54 

76 

80 

81 

59 

86 

78 

71 

77 

89 

45 

93 

72 

71 

76 

94 

75 

50 

83 

82 

72 

77 

75 

65 

79 

72 

78 

77 

79 

72 

82 

74 

80 

49 

75 

78 

64 

80 

49 

49 

88 

51 

78 

85 

65 

75 

77 

69 

92 

91 

53 

86 

49 

79 

68 

87 

61 

81 

55 

93 

53 

84 

70 

73 

93 

50 

87 

77 

74 

89 

87 

76 

59 

80 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 

a.  Construya  una  grafica  de  tallo  y  hoja  para  los  datos. 

b.  ^Como  describirfa  usted  la  forma  de  esta  distribucion? 

datos  1 .65  Colores  de  autos  Los  colores  mas 

populares  para  autos  compactos  y  deportivos  en 
un  ano  reciente  se  dan  en  la  tabla.5 


Color 

Porcentaje 

Color 

Porcentaje 

Plateado 

20 

Rojo 

9 

Gris 

17 

Verde 

6 

Azul 

16 

Cafe  claro 

5 

Negro 

14 

Amarillo/oro 

1 

Blanco 

10 

Otro 

2 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 


Use  un  metodo  grafico  apropiado  para  describir  estos 
datos. 

(^)  datos  1 .66  Starbucks  El  numero  de  cafeterias 

Starbucks  en  ciudades  a  no  mas  de  20  millas  de 
la  Universidad  de  California,  en  Riverside,  se  muestra  en 
la  tabla  siguiente.20 
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Ciudad 

Starbucks 

Ciudad 

Starbucks 

Riverside 

16 

Ontario 

11 

Grand  Terrace 

1 

Norco 

4 

Rialto 

3 

Fontana 

6 

Colton 

2 

Mira  Loma 

1 

San  Bernardino 

5 

Perris 

1 

Redlands 

7 

Highland 

1 

Corona 

7 

Rancho  Cucamonga 

12 

Yucaipa 

2 

Lake  Elsinore 

1 

Chino 

1 

Moreno  Valley 

4 

Fuente:  www.starbucks.com 


a.  Trace  una  grafica  de  puntos  para  describir  los  datos. 

b.  Describa  la  forma  de  la  distribucion. 

c.  7,  Hay  otra  variable  que  usted  pudiera  medir  para 
ayudar  a  explicar  por  que  algunas  ciudades  tienen  mas 
Starbucks  que  otras?  Explique. 

(^)datos  1.67  iQue  es  normal?  Los  98.6  grados 

normales  para  la  temperatura  corporal  en  seres 
humanos  fue  obtenida  por  un  medico  aleman  en  1868. 

En  un  intento  por  verificar  esta  afirmacion,  Mackowiak, 
Wasserman  y  Levine21  tomaron  temperaturas  de  148 
personas  sanas  en  un  periodo  de  tres  dfas.  Un  conjunto  de 
datos,  que  estrechamente  se  compara  con  el  del  articulo 
de  Mackowiak,  fue  obtenido  por  Allen  Shoemaker  y 
aparece  en  la  Journal  of  Statistics  Education.  21  Las 
temperaturas  corporales  para  estas  130  personas  se 
muestran  en  el  histograma  de  frecuencia  relativa  que 
sigue. 


96.8  97.6  98.4  99.2  100.0  100.8 

Temperatura 


a.  Describa  la  forma  de  la  distribucion  de  temperaturas. 

b.  7,  Hay  algunas  observaciones  poco  comunes?  ^Puede 
idear  alguna  explication  para  estas? 

c.  Localice  los  98.6  grados  normales  en  el  eje  horizontal 
de  la  grafica.  ^Parece  estar  cerca  del  centro  de 
distribucion? 


APPLET 


1 .68  Si  todavia  no  lo  hace,  use  el  primer  applet  en 
Building  a  Dotplot  (Construir  una  grafica  de  puntos) 

para  crear  una  grafica  de  puntos  para  el  siguiente 
conjunto  de  datos:  2,  3,  9,  6,  7,  6. 

1 .69  Hamburguesa  con  queso  Use  el  segundo  applet 
en  Building  a  Dotplot  para  crear  una  grafica  de  puntos  el 
numero  de  hamburguesas  con  queso  consumidas  en  una 
semana  determinada  por  10  estudiantes  universitarios: 

4  5  4  2  1 
3  3  4  2  7 

a.  ^Como  describina  usted  la  forma  de  la  distribucion? 

b.  i Que  proportion  de  los  estudiantes  comio  mas  de  4 
hamburguesas  con  queso  esa  semana? 

datos  1.70  Numeros  del  Seguro  Social  Aun 

grupo  de  70  estudiantes  se  le  pidio  registrar  el 
ultimo  digito  de  su  numero  de  Seguro  Social. 


1 

6 

9 

1 

5 

9 

0 

2 

8 

4 

0 

7 

3 

4 

2 

3 

5 

8 

4 

2 

3 

2 

0 

0 

2 

1 

2 

7 

7 

4 

0 

0 

9 

9 

5 

3 

8 

4 

7 

4 

6 

6 

9 

0 

2 

6 

2 

9 

5 

8 

5 

1 

7 

7 

7 

8 

7 

5 

1 

8 

3 

4 

1 

9 

3 

8 

6 

6 

B 

6 

a. 

Antes  de 

<T 

e> 

raficar  los  datos, 

use 

su  sentido  comun  para 

adivinar  la  forma  de  la  distribucion  de  datos.  Explique 
su  razonamiento. 

b.  Use  el  segundo  applet  en  Building  a  Dotplot 
(Construir  una  grafica  de  puntos)  para  crear 
una  grafica  de  puntos  para  describir  los  datos.  ^Su 
intuition  fue  correcta  en  el  inciso  a)? 

1.71  Si  todavia  no  lo  hace,  use  el  primer  applet  en 
Building  a  Histogram  (Construir  un  histograma)  para 
crear  un  histograma  para  los  datos  del  ejemplo  1 . 1 1,  el 
numero  de  visitas  a  Starbucks  durante  una  semana  tipica. 
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(^)datos  1.72  El  Fondo  Unido  El  siguiente  conjunto 
de  datos  registra  las  aportaciones  caritativas 
anuales  (en  dolares)  al  Fondo  Unido,  para  un  grupo  de 
empleados  de  una  universidad  publica. 


41 

81 

80 

65 

47 

56 

80 

69 

79 

63 

28 

51 

112 

71 

83 

84 

82 

103 

80 

70 

77 

75 

59 

63 

63 

80 

101 

115 

99 

CX> 

42 

78 

81 

90 

103 

125 

92 

79 

24 

93 

Use  el  segundo  applet  de  Building  a  Histogram  para 
construir  un  histograma  de  frecuencia  relativa  para  los 
datos.  ,'C’ual  es  la  forma  de  la  distribucion?  7,  Puede  usted 
ver  algunos  resultados  atfpicos  obvios? 

1 .73  Tiempos  de  supervivencia  Altman  y  Bland 
(^)  datos  informan  de  los  tiempos  de  supervivencia 
para  pacientes  con  hepatitis  activa,  la  mitad 
de  ellos  tratados  con  prednisone  y  la  mitad  sin  recibir 
tratamiento.23  Los  datos  que  siguen  estan  adaptados 
de  los  de  estos  investigadores  para  los  tratados  con 
prednisona.  Los  tiempos  de  supervivencia  estan 
registrados  al  mes  mas  cercano: 


8 

127 

11 

133 

52 

139 

57 

142 

65 

144 

87 

147 

93 

148 

97 

157 

109 

162 

120 

165 

a.  Observe  los  datos.  7,  Puede  usted  calcular  la  forma 
aproximada  de  la  distribucion  de  datos? 

b.  Use  el  segundo  applet  de  Building  a  Histogram  para 
construir  un  histograma  de  frecuencia  relativa  para  los 
datos.  ('  Cual  es  la  forma  de  la  distribucion? 

c.  7,  Hay  algunos  resultados  atfpicos  en  el  conjunto? 

Si  es  asf,  ^cuales  tiempos  de  supervivencia  son 
extraordinariamente  cortos? 


CASO 

prActico 

datos  Presion 

sanguinea 


tComo  esta  su  presion  sanguinea? 


La  presion  sanguinea  es  la  presion  que  la  sangre  ejerce  contra  las  paredes  de  las  arterias. 
Cuando  los  medicos  o  enfermeras  miden  la  presion  sanguinea  a  una  persona,  toman  dos 
lecturas.  La  presion  sistolica  es  aquella  cuando  el  corazon  se  contrae  y,  por  lo  tanto, 
bombea.  La  presion  diastolica  es  la  presion  en  las  arterias  cuando  el  corazon  se  dilata.  La 
presion  diastolica  siempre  es  la  menor  de  las  dos  lecturas.  La  presion  sanguinea  varfa  de 
una  persona  a  otra;  tambien  varfa  en  una  sola  persona  de  un  dfa  para  otro  e  incluso  en  un 
mismo  dfa. 

Si  la  presion  sanguinea  de  usted  es  demasiado  alta,  puede  llevarle  a  una  hemorragia 
cerebral  o  un  ataque  al  corazon.  Si  es  demasiado  baja,  la  sangre  no  llega  a  las  extremida- 
des  y  el  paciente  puede  marearse.  La  presion  baja  suele  no  ser  tan  grave. 

Por  lo  tanto,  (:cual  debe  ser  la  presion  de  ustedl  Una  presion  sistolica  de  120  se  con- 
sidera  normal;  una  de  150  es  alta,  pero  como  la  presion  varfa  con  el  genero  y  aumenta 
con  la  edad,  una  mejor  posicion  de  su  presion  sanguinea  se  obtendrfa  al  compararla  con 
la  poblacion  de  presiones  sangufneas  de  todas  las  personas  de  su  genero  y  edad  en  Estados 
Unidos.  Desde  luego,  no  podemos  darle  a  usted  ese  conjunto  de  datos,  pero  podemos  mos- 
trarle  una  muestra  muy  grande  seleccionada  de  el.  Los  datos  de  presion  sanguinea  en  1910 
personas,  965  hombres  y  945  mujeres  entre  15  y  20  anos,  se  encuentran  en  el  sitio  web 
Student  Companion.  Los  datos  son  parte  del  estudio  de  salud  llevado  a  cabo  el  National 
Institutes  of  Health  (NIH).  Las  entradas  para  cada  persona  incluyen  la  edad  y  presiones 
sistolica  y  diastolica  de  esa  persona,  al  momento  de  registrar  la  presion  sanguinea. 


1 .  Describa  las  variables  que  se  han  medido  en  este  estudio.  ^Las  variables  son  cuantita- 
tivas  o  cualitativas?  ^Discretas  o  continuas?  ^Los  datos  son  univariados,  bivariados  o 
multivariados? 

2.  ^Que  tipos  de  metodos  graficos  hay  para  describir  este  conjunto  de  datos?  (,Que  tipos 
de  preguntas  podrfan  ser  contestados  usando  varios  tipos  de  tecnicas  graficas? 
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3 .  U sando  el  conjunto  de  datos  de  presion  sangufnea  sistolica,  construya  un  histograma  de 
frecuencia  relativa  para  los  965  hombres  y  otro  para  las  945  mujeres.  Use  un  paquete 
de  software  de  estadfstica  si  tiene  acceso  a  uno.  Compare  los  dos  histogramas. 

4.  Considere  los  965  hombres  y  945  mujeres  como  toda  la  poblacion  de  interes.  Escoja 
una  muestra  de  n  =  50  hombres  y  n  —  50  mujeres,  registrando  sus  presiones  sanguf- 
neas  sistolicas  y  sus  edades.  Trace  dos  histogramas  de  frecuencia  relativa  para  exhibir 
graficamente  las  presiones  sangumeas  sistolicas  para  sus  dos  muestras.  ^Las  formas 
de  los  histogramas  se  asemejan  a  los  histogramas  de  poblacion  del  inciso  3? 

5.  <',C6mo  se  compara  la  presion  sangufnea  de  usted  con  la  de  otros  de  su  mismo  genero? 
Verifique  su  presion  sangufnea  sistolica  contra  el  histograma  apropiado  del  inciso  3  o 
4  para  determinar  si  la  presion  sangufnea  de  usted  es  “normal”  o  si  es  extraordinaria- 
mente  alta  o  baja. 
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OBJETIVOS  GENERALES _ 

Las  graficas  son  sumamente  utiles  para  la  descripcion 
visual  de  un  conjunto  de  datos,  pero  no  siempre  son  la 
mejor  herramienta  cuando  se  desea  hacer  inferencias 
acerca  de  una  poblacion  a  partir  de  la  informacion  conte- 
nida  en  una  muestra.  Para  este  proposito,  es  mejor  usar 
medidas  numericas  para  construir  una  imagen  mental  de 
los  datos. 


INDICE  DELCAPITULO 

Graficas  de  caja  (2.7) 

Medidas  de  centra:  media,  mediana  y  moda  (2.2) 

Medidas  de  posicion  relativa:  puntajes  z,  percentiles, 
cuartiles  y  el  rango  intercuartil  (2.6) 

Medidas  de  variabilidad:  rango,  varianza  y  desviacion 
estandar  (2.3) 

Teorema  de  Chebyshev  y  la  Regia  Emplrica  (2.4) 


Los  muchachos  de  verano 

yLos  campeones  de  beisbol  de  hoy  son  mejores 
que  los  de  “ayer”?  ^Los  jugadores  de  la  Liga  Na¬ 
tional  batean  mejor  que  los  de  la  Liga  America¬ 
na?  El  estudio  practico  del  final  de  este  capitulo 
contiene  los  promedios  de  bateo  de  campeones 
de  las  ligas  mayores.  Se  pueden  usar  medidas  nu¬ 
mericas  descriptivas  para  contestar  estas  y  otras 
preguntas  similares. 


ENTRENADOR  PERSONAL 

Como  calculo  cuartiles  muestrales? 
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DESCRIPCION  DE  UN  CONJUNTO  DE 
DATOS  CON  MEDIDAS  NUMERICAS 

Las  graficas  pueden  ayudar  a  describir  la  forma  basica  de  una  distribucion  de  datos. 
Sabemos  que  “una  imagen  vale  por  mil  palabras”  pero  hay  limitaciones  para  usar  gra¬ 
ficas.  Supongamos  que  usted  necesita  presentar  sus  datos  a  un  grupo  de  personas  y  que 
el  foco  del  proyector  de  imagenes  se  quema  o  que  usted  necesita  describir  sus  datos  por 
telefono;  no  hay  modo  de  ver  las  graficas.  Necesita  entonces  hallar  otra  forma  de  llevar 
la  imagen  mental  de  los  datos  a  su  audiencia. 

Una  segunda  limitacion  es  que  las  graficas  son  un  tanto  imprecisas  para  usar  en  infe- 
rencia  estadistica.  Por  ejemplo,  supongamos  que  desea  usar  un  histograma  muestral  para 
hacer  inferencias  acerca  de  un  histograma  poblacional.  Como  puede  medir  las  similitu¬ 
des  y  diferencias  entre  los  dos  histogramas  en  alguna  forma  concreta?  Si  son  identicas, 
podrfa  usted  decir  que  son  las  mismas,  pero,  si  son  diferentes,  es  diffcil  describir  el  grado 
de  diferencia. 

Una  forma  de  superar  estos  problemas  es  usar  medidas  numericas,  que  se  pueden 
calcular  para  una  muestra  o  una  poblacion  de  mediciones.  Se  pueden  usar  los  datos 
para  calcular  un  conjunto  de  numeros  que  llevaran  una  buena  imagen  mental  de  la  dis¬ 
tribucion  de  frecuencia.  Estas  mediciones  se  llaman  parametros  cuando  se  asocian  con 
la  poblacion  y  se  denominan  estadisticas  cuando  se  calculan  a  partir  de  mediciones 
muestrales. 


Definicion  Las  mediciones  descriptivas  numericas  asociadas  con  una  poblacion  de 
mediciones  se  llaman  parametros;  las  calculadas  a  partir  de  mediciones  muestrales 
reciben  el  nombre  de  estadisticas. 


MEDIDAS  DE  CENTRO 

En  el  capitulo  1  introdujimos  graficas  de  puntos,  graficas  de  tallo  y  hoja  e  histogramas 
para  describir  la  distribucion  de  un  conjunto  de  mediciones  en  una  variable  cuantita- 
tiva  x.  El  eje  horizontal  presenta  los  valores  de  x,  y  los  datos  estan  “distribuidos”  a  lo 
largo  de  esta  recta  horizontal.  Una  de  las  primeras  mediciones  numericas  importantes  es 
una  medida  de  centro,  es  decir,  una  medida  a  lo  largo  del  eje  horizontal  que  localiza  el 
centra  de  la  distribucion. 

Los  datos  de  peso  al  nacer  presentados  en  la  tabla  1 .9  iban  de  un  punto  bajo  de  5.6  a  uno 
alto  de  9.4,  con  el  centro  del  histograma  situado  en  la  cercanfa  de  7.5  (vease  la  figura  2.1). 
Consideremos  algunas  reglas  para  localizar  el  centro  de  una  distribucion  de  mediciones. 


FIGURA  2.1 

Centro  de  los  datos  de 
peso  al  nacer 
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El  promedio  aritmetico  de  un  conjunto  de  mediciones  es  una  medida  de  centro  muy 
comiin  y  util.  Es  frecuente  que  esta  medida  se  conozca  como  media  aritmetica  o  sim- 
plemente  media,  de  un  conjunto  de  mediciones.  Para  distinguir  entre  la  media  para  la 
muestra  y  la  media  para  la  poblacion,  usamos  el  simbolo  x  (x  barra)  para  una  media 
muestral  y  el  simbolo  /x  para  la  media  de  una  poblacion. 


Definicion  La  media  aritmetica  o  promedio  de  un  conjunto  de  n  mediciones  es 
igual  a  la  suma  de  las  mediciones  dividida  entre  n. 


Como  es  frecuente  que  las  formulas  estadisticas  comprendan  la  suma  de  numeros  o 
“sumarlos”,  usamos  un  simbolo  para  indicar  el  proceso  de  sumar.  Suponga  que  hay  n 
mediciones  en  la  variable  x  y  que  las  llamamos  xh  x2,  xn.  Para  sumar  las  n  medicio¬ 
nes,  usamos  esta  notacion  abreviada: 

n 

Vx;  que  significa  x{  +  x2  +  x3  +  ■  ■  ■  +  xn 

i=  i 

La  letra  griega  mayuscula  (E)  pide  sumar  los  terminos  que  aparezcan  a  su  derecha, 
empezando  con  el  niimero  debajo  de  la  sigma  (i  =  1)  y  terminando  con  el  ntimero  arriba 
(i  =  n).  No  obstante,  como  las  sumas  tipicas  en  calculos  estadisticos  se  hacen  casi  siem- 
pre  sobre  el  conjunto  total  de  n  mediciones,  se  puede  usar  una  notacion  mas  sencilla: 

Ex,  que  significa  “la  suma  de  todas  las  mediciones  de  x” 

Usando  esta  notacion,  escribimos  la  formula  para  la  media  muestral: 


NOTACION 

Media  muestral:  x  = 

Media  poblacional:  fx 

Trace  una  grafica  de  puntos  para  las  n  =  5  mediciones  2,  9,  11,5,  6.  Encuentre  la  media 
muestral  y  compare  su  valor  con  lo  que  usted  pudiera  considerar  el  “centro”  de  estas 
observaciones  en  la  grafica  de  puntos. 

Solucion  La  grafica  de  puntos  de  la  figura  2.2  parece  estar  centrada  entre  6  y  8.  Para 
hallar  la  media  muestral,  calcule 

-  _  ^xi  —  2  +  9  +  11+5  +  6  _  ^  ^ 

Tl  ^ 


FIGURA  2.2 

Grafica  de  puntos  para  el 
ejemplo  2.1 


1 

2 

i 

4 

6  A  8 

Mediciones 

1 

10 

La  estadfstica  x  =  6.6  es  el  punto  de  equilibrio  o  fulcro  que  se  muestra  en  la  grafica  de 
puntos.  Parece  marcar  el  centro  de  los  datos. 
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CONSEJO 


Media  =  punto  de  equilibrio 
o  fulcra. 


Recuerde  que  las  muestras  son  mediciones  tomadas  de  una  poblacion  mas  grande  que 
en  general  es  desconocida.  Un  uso  importante  de  la  media  muestral  x  es  un  estimador  de 
la  media  poblacional  desconocida  fi.  Los  datos  de  peso  al  nacer  en  la  tabla  1 .9  son  una 
muestra  de  una  poblacion  mas  grande  de  peso  al  nacer  y  la  distribucion  se  muestra  en  la 
figura  2.1.  La  media  de  los  30  pesos  al  nacer  es 


_  Ejp  227.2 
*  ~~  30  “  30 


7.57 


ilustrada  en  la  figura  2. 1 ;  marca  el  punto  de  equilibrio  de  la  distribucion.  La  media  de 
toda  la  poblacion  de  pesos  de  recien  nacidos  es  desconocida,  pero  si  usted  tuviera  que 
calcular  su  valor,  su  mejor  estimation  serfa  7.57.  Aun  cuando  cambia  la  media  muestral 
x  de  una  muestra  a  otra,  la  media  poblacional  p  sigue  igual. 

Una  segunda  medida  de  tendencia  central  es  la  mediana,  que  es  el  valor  de  la  posi¬ 
tion  media  en  el  conjunto  de  mediciones  ordenada  de  menor  a  mayor. 


Definicion  La  mediana  m  de  un  conjunto  de  n  mediciones  es  el  valor  de  x  que  cae 
en  la  posicion  media  cuando  las  mediciones  son  ordenadas  de  menor  a  mayor. 


EJEMPLO 


Encuentre  la  mediana  para  el  conjunto  de  mediciones  2,  9,  11,5,  6. 
Soluc  Ordene  las  n  =  5  mediciones  de  menor  a  mayor: 


2  5  6  9  11 

T 


La  observacion  de  enmedio,  marcada  con  una  flecha,  es  el  centra  del  conjunto  o  sea 
m  =  6. 


EJEMPLO 


Encuentre  la  mediana  para  el  conjunto  de  mediciones  2,  9,  11,5,  6,  27. 
Solucion  Ordene  las  mediciones  de  menor  a  mayor: 


2  5  [6  9]  11  27 

t 


CONSEJO 


Casi  50%  de  las  mediciones 
son  mas  pequenas,  50%  son 
mas  grandes  que  la  mediana. 


Ahora  hay  dos  observaciones  “de  enmedio”,  vistas  en  la  caja.  Para  hallar  la  mediana, 
escoja  un  valor  a  la  mitad  entre  las  dos  observaciones  de  enmedio: 


m 


_  6  +  9 
2 


=  7.5 


El  valor  .5 (n  +  1)  indica  la  posicion  de  la  mediana  del  conjunto  ordenado  de  datos. 
Si  la  posicion  de  la  media  es  un  numero  que  termina  en  el  valor  .5,  usted  necesita  pro- 
mediar  los  dos  valores  adyacentes. 

Para  las  n  =  5  mediciones  ordenadas  del  ejemplo  2.2,  la  posicion  de  la  mediana  es 
.5 (n  +  1)  =  .5(6)  =  3  y  la  mediana  es  la  tercera  observacion  ordenada ,  o  m  =  6.  Para 
las  n  =  6  mediciones  ordenadas  del  ejemplo  2.3,  la  posicion  de  la  mediana  es  .5 (n  +  1) 
=  .5(7)  =  3.5  y  la  mediana  es  el promedio  de  las  3ay  4a  observaciones  ordenadas,  o  in 
=  (6  +  9)12  =  7.5. 
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CONSEJO 

Simetrico: 
media  =  mediana. 
Sesgada  a  la  derecha: 
media  >  mediana. 
Sesgada  a  la  izquierda: 
media  <  mediana. 


Aunque  tanto  la  media  como  la  mediana  son  buenas  medidas  del  centro  de  una  dis¬ 
tribucion,  la  mediana  es  menos  sensible  a  valores  extremos  o  resultados  atipicos.  Por 
ejemplo,  el  valor  x  =  27  en  el  ejemplo  2.3  es  mucho  mayor  que  las  otras  mediciones. 
La  mediana,  m  =  7.5,  no  es  afectada  por  el  resultado  atfpico,  en  tanto  que  el  promedio 
muestral, 


n  6 

si  es  afectado;  su  valor  no  es  representative  de  las  cinco  observaciones  restantes. 

Cuando  un  conjunto  de  datos  tiene  valores  extremadamente  pequenos  u  observacio¬ 
nes  muy  grandes,  la  media  muestral  se  traza  hacia  la  direction  de  las  mediciones  extre- 
mas  (vease  la  figura  2.3). 


FiniinA  o  n 


Si  una  distribucion  esta  sesgada  a  la  derecha,  la  media  se  corre  a  la  derecha;  si  una  dis¬ 
tribution  esta  sesgada  a  la  izquierda,  la  media  se  corre  a  la  izquierda.  La  mediana  no  es 
afectada  por  estos  valores  extremos  porque  los  valores  numericos  de  las  mediciones 
no  se  usan  en  este  calculo.  Cuando  una  distribucion  es  simetrica,  la  media  y  la  mediana 
son  iguales.  Si  una  distribucion  esta  fuertemente  sesgada  por  uno  o  mas  valores  extre¬ 
mos,  el  usuario  debe  emplear  la  mediana  en  lugar  de  la  media  como  medida  de  centro. 


Se  puede  ver  el  efecto  de  valores  extremos  en  la  media  y  la  mediana  usando  el  applet 
How  Extreme  Values  Affect  the  Mean  and  Median.  El  primero  de  tres  applets 
(figura  2.4)  muestra  una  grafica  de  puntos  de  los  datos  del  ejemplo  2.2.  Use  su  mouse 
para  mover  la  observacion  mas  grande  (x  =  11)  aun  mas  a  la  derecha.  ^En  que  forma 
esta  observacion  mas  grande  afecta  a  la  media?  ^Como  afecta  a  la  mediana?  Usare- 
mos  este  applet  otra  vez  para  los  ejercicios  Mi  Applet  al  final  del  capitulo. 


FIGURA  2.4 

Forma  en  que  los  valores 
extremos  afectan  al  applet 
de  la  media  y  la  mediana 


Mean  =  6.8 
Median  =  6.0 

*  *  *  *  • 

0  0  23  SO  7.5  10  0  125  ISO  ITS  20  0  22  5  25  0  27  5  30  0  32.5  >30  373  40  0 
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Otra  forma  de  localizar  el  centra  de  una  distribucion  es  buscar  el  valor  de  x  que  se 
presenta  con  la  frecuencia  mas  alta.  Esta  medida  del  centra  se  denomina  moda. 


Definicion  La  moda  es  la  categorfa  que  se  presenta  con  mas  frecuencia  o  el  valor 
de  x  que  se  presenta  con  mas  frecuencia.  Cuando  las  mediciones  en  una  variable  con- 
tinua  se  han  agrupado  como  histograma  de  frecuencia  o  de  frecuencia  relativa,  la  clase 
con  el  pico  mas  alto  o  frecuencia  se  llama  clase  modal,  y  el  punto  medio  de  esa  clase  se 
toma  como  la  moda. 


CONSEJO 


Recuerde  que  puede 
haber  varias  modas  o 
puede  no  haberlas  (si  cada 
observacion  se  presenta  solo 
una  vez). 


La  moda  por  lo  general  se  usa  para  describir  conjuntos  grandes  de  datos,  mientras  que 
la  media  y  la  mediana  se  usan  para  conjuntos  de  datos  grandes  y  pequenos.  De  los  datos 
del  ejemplo  1.1 1.  la  moda  de  la  distribucion  del  numero  de  visitas  hechas  semanalmente 
a  Starbucks  para  30  clientes  es  de  5.  La  clase  modal  y  el  valor  de  x  que  se  presenta  con 
la  mas  alta  frecuencia  son  iguales,  como  se  muestra  en  la  figura  2.5a). 

Para  los  datos  de  la  tabla  1.9,  un  peso  de  7.7  al  nacer  se  presenta  cuatro  veces  y,  por 
tanto,  la  moda  para  la  distribucion  de  pesos  al  nacer  es  7.7.  Usando  el  histograma 
para  hallar  la  clase  modal,  se  encuentra  que  la  clase  con  el  pico  mas  alto  es  la  quinta 
clase,  de  7.6  a  8. 1 .  Nuestra  opcion  para  la  moda  serfa  el  punto  medio  de  esta  clase,  o  sea 
7.85.  Vease  la  figura  2.5b). 

Es  posible  que  una  distribucion  de  mediciones  tenga  mas  de  una  moda.  Estas  modas 
aparecerfan  como  “picos  locales”  en  la  distribucion  de  frecuencia  relativa.  Por  ejemplo, 
si  fueramos  a  tabular  la  longitud  de  los  peces  sacados  de  un  lago  durante  una  temporada, 
podrfamos  obtener  una  distribucion  bimodal,  posiblemente  reflejando  una  mezcla  de 
peces jovenes  y  viejos  en  la  poblacion.  A  veces  las  distribuciones  bimodales  de  tamanos 
o  pesos  reflejan  una  mezcla  de  mediciones  tomadas  en  machos  y  hembras.  En  cualquier 
caso,  un  conjunto  o  distribucion  de  mediciones  puede  tener  mas  de  una  moda. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

2.1  Nos  dann  =  5  mediciones:  0,  5,  1,  1,  3. 

a.  Trace  una  grafica  de  puntos  para  los  datos. 

(sugerencia:  Si  dos  mediciones  son  iguales,  ponga  un 
punto  arriba  del  otro.)  Calcule  el  “centra”  aproximado. 


b.  Encuentre  la  media,  mediana  y  moda. 

c.  Localice  las  tres  mediciones  de  centro  en  la  grafica 
de  puntos  en  el  inciso  a).  Con  base  en  las  posiciones 
relativas  de  la  media  y  mediana,  ('.las  mediciones  son 
simetricas  o  son  sesgadas? 
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2.2  Nos  dan  n  =  8  mediciones:  3,  2,  5,  6,  4,  4,  3,  5. 

a.  Encuentre  x. 

b.  Encuentre  m. 

c.  Con  base  en  los  resultados  de  los  incisos  a)  y  b),  <Tas 
medidas  son  simetricas  o  sesgadas?  Trace  la  grafica  de 
puntos  para  confirmar  su  respuesta. 

2.3  Nos  dan  n  =  10  mediciones:  3,  5,  4,  6,  10,  5,  6, 

9,  2,  8. 

a.  Calcule  x. 

b.  Encuentre  m. 

c.  Encuentre  la  moda. 

APLICACIONES 

2.4  Seguros  de  autos  El  costo  de  asegurar  un  auto 
se  ha  convertido  en  un  tema  de  disgusto  en  California 
porque  las  tasas  de  seguro  dependen  de  variables  tan 
distintas;  por  ejemplo,  la  ciudad  en  la  que  el  usuario 
vive,  el  numero  de  autos  que  tenga  y  la  compafua  en  la 
que  esta  asegurado.  El  sitio  web  www.insurance.ca.gov 
informa  de  la  prima  anual  para  2006-2007  para  un 
hombre  soltero,  con  licencia  de  manejo  durante  6-8  anos, 
que  conduce  un  Honda  Accord  de  12600  a  15  000  millas 
al  ano  y  no  ha  tenido  infracciones  ni  accidentes.1 


Ciudad  Allstate  Century  21 


Long  Beach 

$2617 

$2228 

Pomona 

2305 

2098 

San  Bernardino 

2286 

2064 

Moreno  Valley 

2247 

1890 

Fuente:  www.insurance.ca.gov 

a.  yCTia!  es  el  promedio  de  las  primas  de  Allstate 
Insurance? 

b.  ('  Cual  es  el  promedio  de  las  primas  de  Century  21 
Insurance? 

c.  Si  usted  fuera  consumidor,  ^estarfa  interesado  en  el 
costo  promedio  de  las  primas?  Si  no  es  asf,  yque  le 
interesarfa? 

datos  2.5  Reproductores  de  DVD  Unrepro- 
ductor  de  discos  de  video  es  un  aparato 
cornun  en  casi  todas  las  casas  en  Estados  Unidos.  De 
hecho,  casi  todas  las  familias  los  tienen  y  muchas  tienen 
mas  de  uno.  Una  muestra  de  25  familias  produjo  las 
siguientes  mediciones  en  x,  el  numero  de  los  DVD  en  la 
casa: 


10  2  11 

10  2  10 

0  12  3  2 

1110  1 
3  10  11 

a.  La  distribucion  de  x,  el  numero  de  los  DVD  en  una 
familia,  (-es  simetrica  o  sesgada?  Explique. 

b.  Calcule  el  valor  de  la  moda,  el  valor  de  x  que  se 
presenta  con  mas  frecuencia. 

c.  Calcule  la  media,  la  mediana  y  la  moda  para  estas 
mediciones. 

b.  Trace  un  histograma  de  frecuencia  relativa  para  el 
conjunto  de  datos.  Localice  la  media,  mediana  y  moda 
a  lo  largo  del  eje  horizontal.  7,  Las  respuestas  a  los 
incisos  a)  y  b)  son  correctas? 

2.6  Ingresos  en  Fortune  500  Diez  de  las  companfas 
mas  grandes  de  Estados  Unidos,  seleccionadas  al  azar  de 
Fortune  500,  aparecen  enseguida  junto  con  sus  ingresos 
(en  millones  de  dolares):2 


Companla 

Ingresos 

Companla 

Ingresos 

General  Motors 

$192604 

Target 

$52620 

IBM 

91 134 

Morgan  Stanley 

52498 

Bank  of  America 

83980 

Johnson  &  Johnson 

50514 

Home  Depot 

81  511 

Intel 

38826 

Boeing 

54848 

Safeway 

38416 

Fuente:  Time  Almanac  2007 


a.  Trace  una  grafica  de  tallo  y  hoja  para  los  datos.  (,Los 
datos  estan  sesgados? 

b.  Calcule  el  ingreso  medio  para  estas  10  companfas. 
Calcule  el  ingreso  medio. 

c.  <,Cual  de  las  dos  medidas  del  inciso  b)  describe  mejor 
el  centra  de  los  datos?  Explique. 

2.7  Orden  de  nacimiento  y  personalidad  ^El  orden 
de  nacimiento  tiene  algun  efecto  en  la  personalidad  de 
una  persona?  Un  informe  sobre  un  estudio,  hecho  por  un 
investigador  del  MIT,  indica  que  es  probable  que  los 
hijos  nacidos  despues  del  primogenito  pongan  a  prueba 
lo  establecido,  son  mas  abiertos  a  nuevas  ideas  y  aceptan 
mas  un  cambio.3  De  hecho,  el  numero  de  esta  clase  de 
hijos  es  creciente.  Durante  los  anos  de  la  Depresion  en 
el  decenio  de  1930,  las  familias  promediaban  2.5  hijos 
(59%  despues  del  primogenito),  mientras  que  los  padres 
de  familia  en  la  explosion  demografica  promediaban  de 
tres  a  cuatro  hijos  (68%  despues  del  primogenito).  ^Que 
quiere  decir  el  autor  con  un  promedio  de  2.5  hijos? 
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(^)  datos  2.8  Atunes  Un  artfculo  en  Consumer  Report 
da  el  precio,  un  promedio  estimado  de  una  lata 
de  6  onzas  (180  gramos)  o  un  paquete  de  7.06  onzas 
(210  gramos),  para  14  marcas  diferentes  de  atun  claro 
empacado  en  agua,  basado  en  precios  pagados  a  nivel 
nacional  en  supermercados:4 

.99  1.92  1.23  .85  .65  .53  1.41 

1.12  .63  .67  .69  .60  .60  .66 

a.  Encuentre  el  precio  promedio  para  las  14  marcas 
diferentes  de  atun. 

b.  Encuentre  el  precio  mediano  para  las  14  marcas 
diferentes  de  atun. 

c.  Con  base  en  lo  que  encuentre  en  los  incisos  a)  y  b), 
ypiensa  usted  que  la  distribucion  de  precios  esta 
sesgada?  Explique. 

2.9  Salarios  en  deportes  A  medida  que  los  equipos 
deportivos  profesionales  se  hacen  negocios  cada 

vez  mas  lucrativos  para  sus  propietarios,  los  salarios 
pagados  a  los  jugadores  tambien  han  aumentado.  De 
hecho,  a  las  superestrellas  deportivas  se  les  pagan 
salarios  astronomicos  por  su  talento.  Si  una  compania  de 
administration  deportiva  le  pide  a  usted  que  describa 
la  distribucion  de  salarios  de  jugadores,  en  varias 
categories  diferentes  de  deportes  profesionales,  £  que 
medida  de  centra  escogerfa?  (\Por  que? 

2.10  Tiempo  en  un  trabajo  En  un  experimento 
psicologico,  fue  registrado  el  tiempo  en  un  trabajo  para 
10  personas  bajo  una  limitation  de  5  minutos.  Estas 
mediciones  son  en  segundos: 

175  190  250  230  240 
200  185  190  225  265 

a.  Encuentre  el  tiempo  promedio  en  el  trabajo. 

b.  Encuentre  la  mediana  del  tiempo  en  el  trabajo. 

c.  Si  usted  esta  escribiendo  un  informe  para  describir 
estos  datos,  <t|ue  medida  de  tendencia  central  usarfa? 
Explique. 


datos  2.11  Starbucks  El  numero  de  cafeterias 

Starbucks  en  1 8  ciudades  a  no  mas  de  20  millas 
de  la  Universidad  de  California,  en  Riverside,  se 
muestra  en  la  tabla  siguiente  (www.starbucks.com).5 

16  7  2  64 

17  111 

3  2  11  1 

5  1  4  12 

a.  Encuentre  la  media,  la  mediana  y  la  moda. 

b.  Compare  la  mediana  y  la  media.  (iQuc  puede  usted 
decir  acerca  de  la  forma  de  esta  distribucion? 

c.  Trace  una  grafica  de  puntos  para  los  datos.  y,Esto 
confirma  la  conclusion  de  usted  acerca  de  la  forma  de 
la  distribucion  para  el  inciso  b)? 

(^)datos  2.12  Televisores  de  alta  definicion 

El  costo  de  los  televisores  muestra  enorme 
variation,  de  $100-200  para  uno  estandar  hasta  $8000- 
10000  para  uno  de  pantalla  grande  de  plasma.  Consumer 
Reports  da  los  precios,  para  las  10  principales  marcas  de 
televisores  de  pantalla  de  cristal  liquido  y  alta  definicion, 
en  la  categorfa  de  30  a  40  pulgadas:6 


Marca 

Precio 

JVC  LT-40FH96 

$2900 

Sony  Bravia  KDL-V32XBR1 

1800 

Sony  Bravia  KDL-V40XBR1 

2600 

Toshiba  37HLX95 

3000 

Sharp  Aquos  LC-32DA5U 

1300 

Sony  Bravia  KLV-S32A10 

1500 

Panasonic  Viera  TC-32LX50 

1350 

JVC  LT-37X776 

2000 

LG  37LP1D 

2200 

Samsung  LN-R328W 

1200 

a.  yCual  es  el  precio  promedio  de  estos  10  televisores? 

b.  y.Cual  es  la  mediana  del  precio  de  estos  10  televisores? 

c.  Como  consumidor,  ^estarfa  usted  interesado  en  el 
costo  promedio  de  un  televisor  de  estos?  ^Que  otras 
variables  serfan  importantes  para  usted? 
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MEDIDAS  DE  VARIABILIDAD 


Los  conjuntos  de  datos  pueden  tener  el  mismo  centro  pero  con  aspecto  diferente  por  la 
forma  en  que  los  numeros  se  dispersan  desde  el  centro.  Considere  las  dos  distribuciones 
que  se  muestran  en  la  figura  2.6.  Ambas  distribuciones  estan  centradas  en  x  =  4.  pero 
hay  una  gran  diferencia  en  la  forma  en  que  las  mediciones  se  dispersan  o  varian.  Las 
mediciones  de  la  figura  2.6a)  varian  de  3  a  5;  en  la  figura  2.6b)  las  mediciones  varian  de 
0  a  8. 


FIGURA  2.6 

Variabilidad  o  dispersion 
de  datos 


La  variabilidad  o  dispersion  es  una  muy  importante  caracterfstica  de  datos.  Por 
ejemplo,  si  usted  fabrica  tornillos,  la  variacion  extrema  en  los  diametros  de  los  tornillos 
causarfa  un  alto  porcentaje  de  productos  defectuosos.  Por  el  contrario,  si  estuviera  tra- 
tando  de  discriminar  entre  contadores  buenos  y  malos,  tendrfa  problemas  si  el  examen 
siempre  produjera  calificaciones  con  poca  variacion,  lo  cual  hace  muy  diffcil  la  discri¬ 
mination. 

Las  medidas  de  variabilidad  pueden  ayudarle  a  crear  una  imagen  mental  de  la  dis¬ 
persion  de  los  datos.  Presentaremos  una  de  las  mas  importantes.  La  medida  mas  sencilla 
de  variacion  en  el  rango. 


Definicion  El  rango,  R.  de  un  conjunto  de  n  mediciones  se  define  como  la  diferen¬ 
cia  entre  la  medicion  mas  grande  y  la  mas  pequena. 


Para  los  datos  de  peso  al  nacer  de  la  tabla  1.9,  las  mediciones  varian  de  5.6  a  9.4. 
Por  tanto,  el  rango  es  9.4  —  5.6  =  3.8.  El  rango  es  facil  de  calcular,  facil  de  interpretar 
y  es  una  medida  adecuada  de  variacion  para  conjuntos  pequenos  de  datos.  Pero,  para 
conjuntos  grandes,  el  rango  no  es  una  medida  adecuada  de  variabilidad.  Por  ejemplo,  las 
dos  distribuciones  de  frecuencia  relativa  de  la  figura  2.7  tienen  el  mismo  rango  pero  muy 
diferentes  formas  y  variabilidad. 


FIGURA  2.7 

Distribuciones  con 
igual  rango  ydesigual 
variabilidad 
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^Hay  una  medida  de  variabilidad  que  sea  mas  sensible  que  el  rango?  Considere,  como 
ejemplo,  las  mediciones  muestrales  5,1,  1,  2,  4,  mostradas  como  una  grafica  de  puntos 
en  la  figura  2.8.  La  media  de  estas  cinco  mediciones  es 


FIGURA  2.8 

Grafica  de  puntos  que 
muestra  las  desviaciones 
de  puntos  desde  la  media 


r  =  3.8 


(x.-x) 


X 


como  se  indica  en  la  grafica  de  puntos.  Las  distancias  horizontales  entre  cada  punto 
(medicion)  y  la  media  x.  ayudaran  a  medir  la  variabilidad.  Si  las  distancias  son  grandes, 
los  datos  son  mas  dispersos  o  variables  que  si  las  distancias  son  pequenas.  Si  xt  es  un 
punto  particular  (medicion),  entonces  la  desviacion  de  esa  medicion  desde  la  media  es 
(Xj  -  x).  Las  mediciones  a  la  derecha  de  la  media  producen  desviaciones  positivas  y,  las 
de  la  izquierda,  negativas.  Los  valores  de  x  y  las  desviaciones  para  nuestro  ejemplo  se 
detallan  en  las  columnas  primera  y  segunda  de  la  tabla  2.1. 


TABLA  2.1 


Calculo  de  2(x,  -  x)2 


x  (x,  —  x )  (x,  —  x)2 


5 

1.2 

1.44 

7 

3.2 

10.24 

1 

-2.8 

7.84 

2 

-1.8 

3.24 

4 

.2 

.04 

19 

0.0 

22.80 

Como  las  desviaciones  en  la  segunda  columna  de  la  tabla  contienen  informacion  sobre 
variabilidad,  una  forma  para  combinar  las  cinco  desviaciones  en  una  medida  numerica 
es  promediarlas.  Desafortunadamente,  el  promedio  no  funcionara  porque  algunas  de  las 
desviaciones  son  positivas,  algunas  son  negativas  y  la  suma  es  siempre  cero  (a  menos 
que  errores  redondeados  se  hayan  introducido  en  los  calculos).  Observe  que  las  desvia¬ 
ciones  en  la  segunda  columna  de  la  tabla  2. 1  suman  cero. 

Otra  posibilidad  serfa  no  hacer  caso  de  los  signos  de  las  desviaciones  y  calcular  el 
promedio  de  sus  valores  absolutos.'  Este  metodo  se  ha  usado  como  medida  de  variabi¬ 
lidad  en  el  analisis  exploratorio  de  datos  y  en  el  analisis  de  datos  de  series  de  tiempo. 
Preferimos,  no  obstante,  superar  la  dificultad  causada  por  los  signos  de  las  desviaciones 


f  El  valor  absolute  de  un  numero  es  su  magnitud,  sin  atender  su  signo.  Por  ejemplo,  el  valor  absolute  de  —2, 
representado  por  el  slmbolo  | — 2|,  es  2.  El  valor  absolute  de  2,  esto  es,  |2|,  es  2. 
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al  trabajar  con  su  suma  de  cuadrados.  De  la  suma  de  desviaciones  cuadradas,  se  calcula 
una  sola  medida  llamada  varianza.  Para  distinguir  entre  la  varianza  de  una  muestra  y 
la  varianza  de  una  poblacion,  usamos  el  sfmbolo  s2  para  una  varianza  muestral  y  a 2 
para  una  varianza  de  poblacion.  La  varianza  sera  relativamente  grande  para  datos  muy 
variables  y  relativamente  pequena  para  datos  menos  variables. 


Definicion  La  varianza  de  una  poblacion  de  N  mediciones  es  el  promedio  de  los 
cuadrados  de  las  desviaciones  de  las  mediciones  alrededor  de  su  media  p..  La  varianza 
poblacional  se  denota  con  a2  y  esta  dada  por  la  formula 

_ 2  _  X(xt  -  ri-)2 

a  ~  N 


La  mayor  parte  de  las  veces,  no  tendremos  todas  las  mediciones  de  poblacion  disponi- 
bles  pero  necesitaremos  calcular  la  varianza  de  una  muestra  de  n  mediciones. 


Definicion  La  varianza  de  una  muestra  de  n  mediciones  es  la  suma  de  las  des¬ 
viaciones  cuadradas  de  las  mediciones  alrededor  la  media  x  dividida  entre  (/i  —  1).  La 
varianza  muestral  se  denota  con  s2  y  esta  dada  por  la  formula 

2  _  X(Xj  ~  xf 
s  n  —  1 


Para  el  conjunto  de  n  =  5  mediciones  muestrales  presentadas  en  la  tabla  2.1,  el  cua- 
drado  de  la  desviacion  de  cada  medicion  se  registra  en  la  tercera  columna.  Sumando, 
tendremos 

X(x ,  -  xf  =  22.80 
y  la  varianza  muestral  es 

2  X(x,  -  xf  22.80  r  nn 

V  = - —  =  5.70 

n  —  1  4 

La  varianza  se  mide  en  terminos  del  cuadrado  de  las  unidades  originales  de  medicion. 
Si  las  mediciones  originales  son  en  pulgadas,  la  varianza  se  expresa  en  pulgadas  cuadra¬ 
das.  Tomando  la  rafz  cuadrada  de  la  varianza,  obtenemos  la  desviacion  estandar,  que 
regresa  la  medida  de  variabilidad  a  las  unidades  originales  de  medicion. 


La  varianza  y  la  desviacion 
estandar  no  pueden  ser 
numeros  negativos. 


Definicion  La  desviacion  estandar  de  un  conjunto  de  mediciones  es  igual  a  la  rafz 
cuadrada  positiva  de  la  varianza. 


NOTACION 

n:  numero  de  mediciones  en  la 
muestra 

s:  varianza  muestral 
s  =  V? :  desviacion  muestral  estandar 


N:  numero  de  mediciones  en  la 
poblacion 

a2:  varianza  poblacional 

er  =  V<T2 :  desviacion  poblacional  estandar 
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CONSEJO 


Si  listed  usa  calculadora, 
asegurese  de  escoger 
la  tecla  correcta  para  la 
desviacion  estandar  de 
la  muestra. 


Para  el  conjunto  de  n  =  5  mediciones  muestrales  en  la  tabla  2.1,  la  varianza  muestral 
es  s2  =  5.70,  de  modo  que  la  desviacion  estandar  de  la  muestra  es  a  =  Vs2  =  V5.70 
=  2.39.  Cuanto  mas  variable  sea  el  conjunto  de  datos,  mayor  es  el  valor  de  s. 

Para  el  pequeno  conjunto  de  datos  que  empleamos,  el  calculo  de  la  varianza  no 
es  demasiado  diffcil.  No  obstante,  para  un  conjunto  mas  grande,  los  calculos  pueden 
hacerse  tediosos.  Casi  todas  las  calculadoras  cientfficas  tienen  programas  internos  que 
calcularan  .7  y  s  o  /j.  y  a,  de  modo  que  el  trabajo  computacional  es  minimo  para  el  usua- 
rio.  La  tecla  de  la  muestra  o  media  poblacional  suele  estar  marcada  con  x.  La  tecla  de  la 
desviacion  estandar  de  la  muestra  suele  estar  marcada  s,  sx  o  am-i,  y  la  tecla  de  desvia¬ 
cion  estandar  poblacional  con  a,  ax  o  axn.  A1  usar  cualquier  calculadora  con  estas  teclas 
de  funcion  interna,  asegurese  de  ver  que  calculo  es  realizado  por  cada  tecla. 

Si  necesita  calcular  manualmente  a2  y  s,  es  mucho  mas  facil  usar  la  formula  alter- 
nativa  de  calculo  dada  a  continuation.  Esta  forma  computacional  se  denomina  a  veces 
metodo  breve  para  calcular  .v2. 


FORMULA  COMPUTACIONAL  PARA  CALCULAR  s2 

y  2  _  (Sx,-) 

2  n 

s  = - 

n  —  1 


Los  sfmbolos  (Sx,)2  y  Sx2  en  la  formula  computacional  son  metodos  breves  para  indicar 
la  operacion  aritmetica  que  es  necesario  efectuar.  El  usuario  sabe  de  la  formula  para  la 
media  muestral  que  Sx,  es  la  suma  de  todas  las  mediciones.  Para  hallar  Sx2,  eleve  al 
cuadrado  cada  medicion  individual  y  luego  sumelas. 


Sx2  =  Suma  de  cuadrados  de  las  mediciones  individuals 
(Sx,)2  =  Cuadrado  de  la  suma  de  las  mediciones  individuals 


La  desviacion  estandar  de  la  muestra,  s,  es  la  rafz  cuadrada  positiva  de  s2. 

Calcule  la  varianza  y  desviacion  estandar  para  las  cinco  mediciones  de  la  tabla  2.2,  que 
son  5,  7,  1,  2,  4.  Use  la  formula  computacional  para  s2  y  compare  sus  resultados  con  los 
obtenidos  usando  la  definicion  original  de  s2. 


tabla  2.2  Tabla  para  calculo  simplificado  de  s2  y  s 


Xj 

x2, 

5 

25 

7 

49 

2 

4 

4 

16 

19 

95 
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CONSEJO 


No  redondee  resultados 
parciales  al  continuar. 


Solucion  Las  entradas  en  la  tabla  2.2  son  las  mediciones  individuales,  xh  y  sus  cua- 
drados,  x 2,  junto  con  sus  sumas.  Usando  la  formula  computacional  para  .v2,  tenemos 

V  2  (2X;)2 

2  ^--Sr 

?  n-  1 

95 

_  5  _  22.80  _  ,  nn 


y  s  =  Vs2  =  V5.70  =  2.39,  como  antes. 


Usted  se  puede  preguntar  por  que  es  necesario  dividir  entre  (n  —  1)  en  lugar  de  n 
cuando  calcula  la  varianza  muestral.  As!  como  empleamos  la  media  muestral  x  para 
estimar  la  media  poblacional  /jl,  se  puede  usar  la  varianza  muestral  s  para  estimar  la 
varianza  poblacional  cT.  Resulta  que  la  varianza  muestral  s  con  (n  —  1)  en  el  deno- 
minador  da  estimaciones  mejores  de  er  de  lo  que  darfa  un  estimador  calculado  con  n 
en  el  denominador.  Por  esta  razon,  siempre  dividimos  entre  (n  —  1)  al  calcular  la 
varianza  muestral  s2  y  la  desviacion  estandar  de  la  muestra  .v. 


Se  puede  comparar  la  precision  de  estimadores  de  la  varianza  poblacional  er2  usando 
el  applet  Why  Divide  by  n  —  1?  El  applet  selecciona  muestras  de  una  poblacion  con 
desviacion  estandar  a  =  29.2.  A  continuation  calcula  la  desviacion  estandar  ,v  usando 
(n  —  1)  en  el  denominador  asf  como  una  desviacion  estandar  calculada  usando  n 
en  el  denominador.  Se  puede  escoger  para  comparar  los  estimadores  para  una  sola 
muestra  nueva,  para  10  muestras  o  para  100  muestras.  Observe  que  cada  una  de  las 
10  muestras  que  aparecen  en  la  figura  2.9  tiene  una  desviacion  estandar  diferente. 
No  obstante,  cuando  las  10  desviaciones  estandar  se  promedian  en  la  parte  inferior 
del  applet,  uno  de  los  dos  estimadores  es  mas  cercano  a  la  desviacion  estandar  de  la 
poblacion  a  =  29.2.  ^Cual  es?  Usaremos  este  applet  otra  vez  para  los  ejercicios  Mi 
Applet  al  final  del  capftulo. 


FIGURA  2.9 

Applet  Why  Divide  by 
n  —  1?  (iPor  que  dividir 
entre  n  -  1?) 


Results  displayed  fui  l«st  10  samples  uf  sue3 
St  Dev.  when  dividing  by  n  1 
38  0  *42.8  33.7  130  20  0  1*4.2  9.0  23.3  9  3  32.7 
3t  Dev.  when  dividing  by  n 
31.5  34  0  27.5  110  21.2  11  6  7  4  10.0  7  6  26  7 
Aveieges  uf  3L  Dev  hum  <11  10  samples. 

when  dividing  by  n  :  22.0 


N  0 i.'i.i  S  ample  1 0  S  ample 1 0 0  S  a  m  p  I e s 
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En  este  punto,  usted  ha  aprendido  a  calcular  la  varianza  y  desviacion  estandar  de  un 
conjunto  de  mediciones.  Recuerde  estos  puntos: 


•  El  valor  de  s  es  siempre  mayor  o  igual  a  cero. 

•  Cuanto  mayor  sea  el  valor  de  s2  o  de  s,  mayor  es  la  variabilidad  del  conjunto  de 
datos. 

•  Si  s2  o  ^  es  igual  a  cero,  todas  las  mediciones  deben  tener  el  mismo  valor. 

•  Para  medir  la  variabilidad  en  las  mismas  unidades  que  las  observaciones  origina¬ 
tes,  calculamos  la  desviacion  estandar  s  =  V?. 


Esta  information  permite  comparar  varios  conjuntos  de  datos  con  respecto  a  sus  ubica- 
ciones  y  su  variabilidad.  ^Como  se  pueden  usar  estas  mediciones  para  decir  algo  mas 
especffico  acerca  de  un  solo  conjunto  de  datos?  El  teorema  y  la  regia  que  se  presentan 
en  la  siguiente  section  ayudaran  a  contestar  esta  pregunta. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

2.13  Nos  dan  n  =  5  mediciones:  2,  1,  1,  3,  5. 

a.  Calcule  la  media  muestral,  x. 

b.  Calcule  la  varianza  muestral,  s2,  usando  la  formula 
dada  por  la  definicion. 

c.  Encuentre  la  desviacion  estandar  de  la  muestra,  s. 

d.  Encuentre  s2  y  s  usando  la  formula  computacional. 
Compare  los  resultados  con  los  hallados  en  los  incisos 
b)  y  c). 

2.14  Consulte  el  ejercicio  2.13. 

a.  Use  el  metodo  de  entrada  de  datos  en  su  calculadora 
cientffica  para  introducir  las  cinco  mediciones. 
Recuerde  las  memorias  apropiadas  para  hallar  la 
media  muestral  y  desviacion  estandar. 

b.  Verifique  que  la  calculadora  de  los  mismos  valores  para 
xy  s  como  en  el  ejercicio  2. 13,  incisos  a)  y  c). 

2.15  Nos  dan  n  =  8  mediciones:  4,  1,  3,  1,  3,  1,  2,  2. 

a.  Encuentre  el  rango. 

b.  Calcule  x. 

c.  Calcule  s2  y  s  usando  la  formula  computacional. 

d.  Use  el  metodo  de  entrada  de  datos  en  su  calculadora 
para  hallar  x,  s  y  s2.  Verifique  que  sus  respuestas  sean 
iguales  a  las  de  los  incisos  b)  y  c). 


2.16  Nos  dan  n  =  8  mediciones:  3,  1,  5,  6,  4,  4,  3,  5. 

a.  Calcule  el  rango. 

b.  Calcule  la  media  muestral. 

c.  Calcule  la  varianza  muestral  y  desviacion  estandar. 

d.  Compare  el  rango  y  la  desviacion  estandar.  Li  I 
rango  es  aproximadamente  cuantas  desviaciones 
estandar? 

APLICACIONES 

2.17  Un  hallazgo  arqueologico,  otra  vez  Un 

artfculo  en  Archaeometry  contenfa  un  analisis  de  26 
muestras  de  ceramica  romano-britanica  hallada  en  cuatro 
hornos  diferentes  en  el  Reino  Unido.7  Las  muestras 
fueron  analizadas  para  determinar  su  composition 
quimica.  El  porcentaje  de  oxido  de  hierro  en  cada  una 
de  las  cinco  muestras  recolectadas  en  el  sitio  de  Island 
Thoms  fue: 

1.28  2.39  1.50  1.88  1.51 

a.  Calcule  el  rango. 

b.  Calcule  la  varianza  muestral  y  la  desviacion  estandar 
usando  la  formula  computacional. 

c.  Compare  el  rango  y  la  desviacion  estandar.  ^E1 
rango  es  aproximadamente  cuantas  desviaciones 
estandar? 
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(^)datos  2.18  Estados  de  cuenta  por  consumo 

electrico  en  el  sur  de  California  Los  estados 
de  cuenta  mensuales  por  consumo  electrico  para  una 
familia  en  Riverside,  California,  se  registraron  durante  12 
meses  consecutivos  empezando  en  enero  de  2006: 


Mes 

Cantidad  ($) 

Mes 

Cantidad  ($) 

Enero 

$266.63 

Julio 

$306.55 

Febrero 

163.41 

Agosto 

335.48 

Marzo 

219.41 

Septiembre 

343.50 

Abril 

162.64 

Octubre 

226.80 

Mayo 

187.16 

Noviembre 

208.99 

Junio 

289.17 

Diciembre 

230.46 

a.  Calcule  el  rango  del  pago  de  electricidad  para  el  ano 
2006. 

b.  Calcule  el  promedio  mensual  de  pago  de  electricidad 
en  2006. 

c.  Calcule  la  desviacion  estandar  para  el  pago  de 
electricidad  para  el  mismo  ano. 


SOBRE  LA  SIGNIFICANCE  PRACTICA 
DE  LA  DESVIACION  ESTANDAR 

A  continuacion  introducimos  un  util  teorema  ideado  por  el  matematico  ruso  Chebyshev. 
La  demostracion  del  teorema  no  es  diffcil,  pero  estamos  mas  interesados  en  su  aplica- 
cion  que  en  demostrarlo. 


Dado  un  numero  k  mayor  o  igual  a  1  y  un  conjunto  de  n  mediciones,  al  menos  [1  -  (1  /Ac2)]  de 
Chebyshev  las  mediciones  estaran  dentro  de  /cdesviaciones  estandar  de  su  media. 


El  teorema  de  Chebyshev  aplica  a  cualquier  conjunto  de  mediciones  y  se  puede  usar 
para  describir  ya  sea  una  muestra  o  una  poblacion.  Usaremos  la  notacion  apropiada  para 
poblaciones,  pero  usted  debe  ver  que  con  la  misma  facilidad  podrfamos  usar  la  media  y 
la  desviacion  estandar  para  la  muestra. 

La  idea  comprendida  en  el  teorema  de  Chebyshev  esta  ilustrada  en  la  figura  2.10. 
Se  construye  un  intervalo  al  medir  una  distancia  ka  a  cualquier  lado  de  la  media  /j..  El 
numero  k  puede  ser  cualquier  numero  mientras  sea  mayor  o  igual  a  1.  Entonces  el  teo¬ 
rema  de  Chebyshev  expresa  que  al  menos  [1  —  (1  lie)]  del  numero  total  n  de  mediciones 
esta  en  el  intervalo  construido. 


FIGURA  2.1  O 

llustracion  del  teorema  de 
Chebyshev 


|< — ko- 


ko — >-| 
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En  la  tabla  2.3  escogimos  unos  cuantos  valores  numericos  para  k  y  calculamos 
[1  -  (1/it2)]. 

tabla  2.3  Valores  ilustrativos  de  [1  —  ( 1  / /c2)] 

k_ 1  -  (1/A2) 

1  1-1=0 

2  1  -  1/4  =  3/4 

3  1  -  1/9  =  8/9 


De  los  calculos  de  la  tabla  2.3,  el  teorema  establece  que: 


•  A1  menos  ninguna  de  las  mediciones  esta  en  el  intervalo  ji  —  a  a  /j,  +  a. 

•  A1  menos  3/4  de  las  mediciones  estan  en  el  intervalo  /j.  —  2cra  \x  +  2a. 

•  A1  menos  8/9  de  las  mediciones  estan  en  el  intervalo  /j.  —  3era  /x  +  3  a. 


Aun  cuando  el  primer  enunciado  no  es  util  en  absoluto,  los  otros  dos  valores  de  k  dan 
valiosa  informacion  acerca  de  la  proporcion  de  mediciones  que  caen  en  ciertos  interva- 
los.  Los  valores  &  =  2y£  =  3no  son  los  unicos  valores  de  k  que  se  pueden  usar;  por 
ejemplo,  la  proporcion  de  mediciones  que  caen  dentro  de  k  =  2.5  desviaciones  estandar 
de  la  media  es  al  menos  1  —  [l/(2.5)2]  =  .84. 

La  media  y  varianza  de  una  muestra  de  n  =  25  mediciones  son  75  y  100,  respectiva- 
mente.  Use  el  teorema  de  Chebyshev  para  describir  la  distribucion  de  mediciones. 

Nos  dan  x  =  75  y  s2  =  100.  La  desviacion  estandar  es  s  =  V 100  =  10.  La 
distribucion  de  mediciones  esta  centrada  alrededor  de  x  =  75,  y  el  teorema  de  Chebyshev 
establece  que: 


•  Al  menos  3/4  de  las  25  mediciones  estan  en  el  intervalo  x  ±  2s  =  75  ±  2(10),  esto 
es,  55  a  95. 

•  Al  menos  8/9  de  las  mediciones  estan  en  el  intervalo  x  ±  3s  =  75  ±  3(10),  esto 
es,  45  a  105. 


FIGURA  2.1  1 

Distribucion  en  forma 
de  montfculo 


Como  el  teorema  de  Chebyshev  se  aplica  a  cualquier  distribucion,  es  muy  conser- 
vador.  Esta  es  la  razon  por  la  que  hacemos  hincapie  en  “al  menos  1  —  (\/k2)”  en  este 
teorema. 

Otra  regia  para  describir  la  variabilidad  de  un  conjunto  de  datos  no  funciona  para 
todos  los  conjuntos  de  datos,  pero  funciona  muy  bien  para  datos  que  “se  apilan”  en  la 
conocida  forma  de  monticulo  de  la  figura  2.11.  Cuanto  mas  cerca  se  encuentre  la  dis¬ 
tribucion  a  la  curva  en  forma  de  montfculo  de  la  figura  2.11,  mas  precisa  sera  la  regia. 
Como  la  distribucion  de  datos  en  forma  de  montfculo  se  presenta  con  frecuencia  en  la 
naturaleza,  la  regia  se  puede  usar  numerosas  ocasiones  en  aplicaciones  practicas.  Por 
esta  razon,  se  denomina  Regia  empfrica. 
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Regia  empfrica  Dada  una  distribucion  de  mediciones  que  dene  forma  aproximada 
de  montfculo: 


CONSEJO 

Recuerde  estos  tres  numeros: 

68—95—99.7 

E  J  E  M  P  L  O 


El  intervalo  (/ x  ±  cr)  contiene  aproximadamente  68%  de  las  mediciones. 

El  intervalo  (/x  ±  2cr)  contiene  aproximadamente  95%  de  las  mediciones. 
El  intervalo  (jx  ±  3cr)  contiene  aproximadamente  99.7%  de  las  mediciones. 


La  distribucion  en  forma  de  montfculo  que  se  muestra  en  la  figura  2.11  se  conoce  comun- 
mente  como  distribucion  normal  y  se  estudiara  en  detalle  en  el  capftulo  6. 

En  un  estudio  de  tiempo  efectuado  en  una  planta  manufacturera,  el  tiempo  para  com- 
pletar  una  operation  especificada  se  mide  para  cada  uno  de  los  n  =  40  trabajadores.  Se 
encuentra  que  la  media  y  la  desviacion  estandar  son  12.8  y  1.7,  respectivamente.  Des- 
criba  los  datos  muestrales  usando  la  Regia  empfrica. 


Solucion  Para  describir  los  datos,  calcule  estos  intervalos: 


(x  ±  ,v)  =  12.8  ±  1.7 
(x  ±  2s)  =  12.8  ±  2(1.7) 
(x  ±  35)  =  12.8  ±  3(1.7) 


o  11.1  a  14.5 

o  9.4  a  16.2 

o  7.7  a  17.9 


De  acuerdo  con  la  Regia  empfrica,  se  espera  que  aproximadamente  68%  de  las  medicio¬ 
nes  caigan  en  el  intervalo  de  11.1  a  14.5,  aproximadamente  95%  caigan  en  el  intervalo 
de  9.4  a  16.2,  y  aproximadamente  99.7%  caigan  en  el  intervalo  de  7.7  a  17.9. 

Si  hay  duda  de  que  la  distribucion  de  mediciones  tenga  forma  de  montfculo  o  si 
se  desea  ser  conservador  por  alguna  razon,  se  puede  aplicar  el  teorema  de  Chebyshev 
y  estar  absolutamente  seguro  de  sus  afirmaciones.  El  teorema  de  Chebyshev  dice  que 
al  menos  3/4  de  las  mediciones  caen  en  el  intervalo  de  9.4  a  16.2  y  al  menos  8/9  en  el 
intervalo  de  7.7  a  17.9. 


Los  maestros-estudiantes  son  capacitados  para  desarrollar  planes  de  lecciones,  en  la  su- 
posicion  de  que  el  plan  escrito  les  ayudara  a  trabajar  de  manera  satisfactoria  en  el  salon 
de  clases.  En  un  estudio  para  evaluar  la  relation  entre  planes  de  leccion  escritos  y  su  im¬ 
plementation  en  el  salon  de  clases,  se  calificaron  25  planes  de  leccion  en  una  escala  de  0  a 
34  de  acuerdo  a  una  Lista  de  verification  de  Plan  de  leccion.  Las  25  calificaciones  se 
muestran  en  la  tabla  2.4.  Use  el  teorema  de  Chebyshev  y  la  Regia  empfrica  (si  es  aplica- 
ble)  para  describir  la  distribucion  de  estas  calificaciones  de  evaluation. 


tabla  2.4  Calificaciones  para  evaluation  de  Plan  de  lection 


26.1 

26.0 

14.5 

29.3 

197 

22.1 

21.2 

26.6 

31.9 

25.0 

15.9 

20.8 

20.2 

17.8 

13.3 

25.6 

26.5 

15.7 

22.1 

13.8 

29.0 

21.3 

23.5 

22.1 

10.2 

Solucion  Use  su  calculadora  o  las  formulas  computacionales  para  verificar  que  x  = 
21.6  y  s  =  5.5.  Los  intervalos  apropiados  estan  calculados  y  aparecen  en  la  tabla  2.5. 
Tambien  hemos  consultado  las  25  mediciones  originales  y  contado  el  numero  real  de 
mediciones  que  caen  en  cada  uno  de  estos  intervalos.  Estas  frecuencias  y  frecuencias 
relativas  aparecen  en  la  tabla  2.5. 
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TABLA  2.5  Intervalos  x  ±  ks  para  los  datos  de  la  tabla  2.4 


k 

Intervalo  x±  ks 

Frecuencia 
en  intervalo 

Frecuencia  relativa 

1 

16.1-27.1 

16 

.64 

2 

10.6-32.6 

24 

.96 

3 

5.1-38.1 

25 

1.00 

CONSEJO 


Regia  empirica  <=>  datos  en 
forma  de  monticulo. 


Chebyshev  <=>  datos  en 
cualquier  forma. 


I  Es  aplicable  el  teorema  de  Chebyshev?  Si,  porque  se  puede  usar  para  cualquier  con- 
junto  de  datos.  De  acuerdo  con  el  teorema  de  Chebyshev, 

•  al  menos  3/4  de  las  mediciones  caeran  entre  10.6  y  32.6. 

•  al  menos  8/9  de  las  mediciones  caeran  entre  5.1  y  38.1. 

Se  puede  ver  en  la  tabla  2.5  que  el  teorema  de  Chebyshev  es  verdadero  para  estos  datos. 
De  hecho,  las  proporciones  de  mediciones  que  caen  en  los  intervalos  especificados  exce- 
den  el  limite  inferior  dado  por  este  teorema. 

I  Es  aplicable  la  Regia  empirica?  Usted  puede  comprobarlo  por  si  mismo  si  traza  una 
grafica,  ya  sea  una  grafica  de  tallo  y  hoja  o  un  histograma.  El  histograma  MINITAB  de  la 
figura  2.12  muestra  que  la  distribution  relativamente  tiene  forma  de  monticulo,  de  modo 
que  la  Regia  empirica  debe  funcionar  relativamente  bien.  Esto  es, 

•  aproximadamente  68%  de  las  mediciones  caeran  entre  16.1  y  27.1. 

•  aproximadamente  95%  de  las  mediciones  caeran  entre  10.6  y  32.6. 

•  aproximadamente  99.7%  de  las  mediciones  caeran  entre  5.1  y  38.1. 


Las  frecuencias  relativas  de  la  tabla  2.5  se  aproximan  mucho  a  las  especificadas  por  la 
Regia  empirica. 


FinnnA  o  i  o 


8.5  14.5  20.5  26.5  32.5 

Calificaciones 


USO  DEL  TEOREMA  DE  CHEBYSHEV 
Y  LA  REGLA  EMPIRICA 

El  teorema  de  Chebyshev  se  puede  demostrar  matematicamente.  Se  aplica  a  cual¬ 
quier  conjunto  de  mediciones,  muestra  o  poblacion,  grande  o  pequeno,  en  forma  de 
monticulo  o  sesgado. 

El  teorema  de  Chebyshev  da  un  lfmite  inferior  a  la  fraction  de  mediciones  a 
encontrar  en  un  intervalo  construido  como  x  ±  ks.  j Al  menos  1  —  (1  Ik2)  de  las  medi¬ 
ciones  caeran  en  este  intervalo,  y  probablemente  mas ! 
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La  Regia  empfrica  es  una  “regia  practica”  que  se  puede  usar  como  herramienta 
descriptiva  cuando  los  datos  tienden  a  ser  de  forma  mas  o  menos  de  montfculo  (los 
datos  tienden  a  apilarse  cerca  del  centro  de  la  distribucion). 

Cuando  se  usen  estas  dos  herramientas  para  describir  un  conjunto  de  medicio- 
nes,  el  teorema  de  Chebyshev  siempre  se  satisface  pero  es  una  estimacion  muy 
conservadora  de  la  fraccion  de  mediciones  que  caen  en  un  intervalo  particular.  Si  es 
apropiado  usar  la  Regia  empirica  (datos  en  forma  de  montfculo),  esta  regia  dara  una 
estimacion  mas  precisa  de  la  fraccion  de  mediciones  que  caen  en  el  intervalo. 


UNA  MEDICION  DEL  CALCULO  DE  s 


El  teorema  de  Chebyshev  y  la  Regia  empfrica  se  pueden  usar  para  detectar  errores  bur- 
dos  en  el  calculo  de  s.  En  terminos  generales,  estas  dos  herramientas  indican  que  casi 
siempre  las  mediciones  caen  dentro  de  dos  desviaciones  estandar  de  su  media.  Este 
intervalo  esta  marcado  en  la  figura  2.13,  e  implica  que  el  rango  total  de  mediciones, 
de  la  mas  pequena  a  la  mas  grande,  debe  estar  en  algun  punto  alrededor  de  cuatro  des¬ 
viaciones  estandar.  Esto  es,  desde  luego,  una  aproximacion  muy  burda  pero  puede  ser 
muy  util  para  localizar  errores  grandes  en  el  calculo  de  5.  Si  el  rango,  R,  es  de  alrededor 
de  cuatro  desviaciones  estandar,  o  4s,  se  puede  escribir 


R  ~  4s  o  bien  s  ~ 


El  valor  calculado  de  s  usando  la  formula  de  atajo  debe  ser  de  alrededor  del  mismo  orden 
que  la  aproximacion. 


FIGURA  2.1  3 

Aproximacion  de  rango  2s  +  2s 

Para  s  _ I _ I _ I _ I _ I _ 

x-2s  x  x  +  2  s 


EJEMPLO 


Use  la  aproximacion  de  rango  para  comprobar  el  calculo  de  .v  para  la  tabla  2.2. 
Solucion  El  rango  de  las  cinco  mediciones,  5,  7,  1,  2,  4,  es 


R  =  1  —  1  =  6 


Entonces 


Esto  es  del  mismo  orden  que  el  valor  calculado  s  =  2.4. 


s  =  Ft/ 4  solo  da  un  valor 

aproximado  para  s. 


La  aproximacion  de  rango  no  tiene  la  finalidad  de  dar  un  valor  preciso  para  .v.  Mas 
bien,  su  proposito  es  detectar  errores  burdos  de  calculo,  por  ejemplo  no  dividir  la  suma 
de  cuadrados  de  desviaciones  entre  (n  —  1)  o  no  tomar  la  rafz  cuadrada  de  s2.  Si  usted 
comete  uno  de  estos  errores,  su  respuesta  sera  muchas  veces  mas  grande  que  la  aproxi¬ 
macion  de  rango  de  .s. 
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Use  la  aproximacion  de  rango  para  determinar  un  valor  aproximado  para  la  desviacion 
estandar  para  los  datos  de  la  tabla  2.4. 


Soli:  El  rango  R  =  31.9  —  10.2  =  21.7.  Entonces 


s  ~ 


R 

4 


21.7 

4 


=  5.4 


Como  el  valor  exacto  de  s  es  5.5  para  los  datos  de  la  tabla  2.4,  la  aproximacion  es  muy 
cercana. 


El  rango  para  una  muestra  de  n  mediciones  dependera  del  tamano  muestral,  n.  Para 
valores  mas  grandes  de  n,  se  espera  un  rango  mas  grande  de  valores  x.  El  rango  para  mues- 
tras  grandes  (por  ejemplo  n  =  50  o  mas  observaciones)  puede  ser  hasta  de  6s,  mientras 
que  el  rango  para  muestras  pequenas  (por  ejemplo  n  =  5  o  menos)  puede  ser  de  solo 
2.5 s  o  menor. 

La  aproximacion  de  rango  para  s  se  puede  mejorar  si  se  sabe  que  la  muestra  se  toma 
de  una  distribucion  de  datos  en  forma  de  monticulo.  Entonces,  la  5  calculada  no  debe  di- 
ferir  de  manera  importante  a  partir  del  rango  dividido  entre  la  razon  apropiada  dada  en 
la  tabla  2.6. 


TABLA  2.6 


« 


Divisor  para  la  aproximacion  de  rango  de  s 

Numerode  Razon  esperada 

mediciones  de  rango  para  s 


5  2.5 

10  3 

25  4 


© 


EJERCICIOS 


TECNICAS  BASICAS 

2.19  Un  conjunto  de  n  =  10  mediciones  consta  de  los 
valores  5,  2,  3,6,  1,2,  4,5,  1,3. 

a.  Use  la  aproximacion  de  rango  para  estimar  el  valor  de 
s  para  este  conjunto.  (sugerencia:  Use  la  tabla  del 
final  de  la  seccion  2.5.) 

b.  Use  su  calculadora  para  hallar  el  valor  real  de  .v. 

^E1  valor  real  es  cercano  a  la  estimacion  de  usted 
en  el  inciso  a)? 

c.  Trace  una  grafica  de  puntos  de  este  conjunto  de  datos. 
(.Los  datos  tienen  forma  de  monticulo? 

d.  ,'.Puede  usar  el  teorema  de  Chebyshev  para  describir 
este  conjunto  de  datos?  /.Por  que  si  o  por  que  no? 


y  que  sabe  que  la  media  y  desviacion  estandar  del 
conjunto  de  datos  son  36  y  3,  respectivamente. 

a.  Si  esta  mas  o  menos  seguro  que  la  distribucion 
de  frecuencia  relativa  de  los  datos  tiene  forma  de 
monticulo,  ('.cnmo  podria  representar  la  distribucion 
de  frecuencia  relativa? 

b.  Si  no  tiene  usted  informacion  previa  respecto  a  la 
forma  de  la  distribucion  de  frecuencia  relativa,  ('.que 
puede  decir  acerca  del  histograma  de  frecuencia 
relativa?  (sugerencia:  Construya  intervalos  x  ±  ks 
para  varias  opciones  de  k.) 

2.21  Una  distribucion  de  mediciones  tiene  relativamente 
la  forma  de  un  monticulo  con  media  de  50  y  desviacion 
estandar  de  10. 


e.  ('.Puede  usar  la  Regia  empirica  para  describir  este 
conjunto  de  datos?  ,.Por  que  si  o  por  que  no? 

2.20  Supongamos  que  usted  desea  crear  una  imagen 
mental  del  histograma  de  frecuencia  relativa  para  un 
conjunto  de  datos  grande  formado  por  mil  observaciones 


a.  (.Que  proporcion  de  las  mediciones  caera  entre  40 
y  60? 

b.  (.Que  proporcion  de  las  mediciones  caera  entre  30 
y  70? 


www.FreeLibros.me 


72  O  CAPITULO  2  DESCRIPCION  DE  DATOS  CON  MEDIDAS  NUMERICAS 


c.  ^Que  proportion  de  las  mediciones  caera  entre  30 
y  60? 

d.  Si  se  escoge  una  medicion  al  azar  de  esta  distribution, 
^cual  es  la  probabilidad  de  que  sea  mayor  a  60? 

2.22  Un  conjunto  de  datos  tiene  una  media  de  75  y 
una  desviacion  estandar  de  5.  Usted  no  sabe  nada  mas 
acerca  del  tamano  del  conjunto  de  datos  o  de  la  forma 
de  la  distribution  de  datos. 

a.  ^Que  puede  decir  acerca  de  la  proportion  de 
mediciones  que  caen  entre  60  y  90? 

b.  ^Que  puede  decir  acerca  de  la  proportion  de 
mediciones  que  caen  entre  65  y  85? 

c.  ^Que  puede  decir  acerca  de  la  proportion  de 
mediciones  que  sean  menores  de  65? 

APLICACIONES 

2.23  Emergences  de  automovilistas  El  tiem- 
po  requerido  para  que  el  conductor  de  un  automovil 
responda  a  una  situation  particular  de  emergencia 
se  registro  para  n  =  10  conductores.  Los  tiempos 
(en  segundos)  fueron  .5,  .8,  1.1,  .7,  .6,  .9,  .7,  .8,  .7,  8. 

a.  Busque  en  los  datos  y  use  el  procedimiento  de  la 
section  2.5  para  hallar  un  valor  aproximado  para  .v. 
Use  este  valor  para  verificar  sus  calculos  del 
inciso  b). 

b.  Calcule  la  media  muestral  x  y  la  desviacion  estandar  .v. 
Compare  con  el  inciso  a). 

2.24  Empacar  carne  para  hamburguesas 

datos  Los  datos  que  aparecen  enseguida  son  los 
pesos  (en  libras)  de  27  paquetes  de  carne 
molida  de  res,  vistos  en  una  pantalla  de  un 
supermercado: 


1.08 

.99 

.97 

1.18 

1.41 

1.28 

1.06 

1.14 

1.38 

.75 

.96 

1.08 

.89 

.89 

.96 

1.12 

1.12 

.93 

.89 

.98 

1.14 

.92 

1.18 

1.17 

a.  Construya  una  grafica  de  tallo  y  hoja  o  un  histograma 
de  frecuencia  relativa  para  mostrar  la  distribution  de 
pesos.  (-.La  distribution  es  relativamente  de  forma 

de  montfculo? 

b.  Encuentre  la  media  y  desviacion  estandar  del  conjunto 
de  datos. 

c.  Encuentre  el  porcentaje  de  mediciones  en  el  intervalo 
x  ±  s,  x  ±  2s  y  x  ±  3s. 

d.  Los  porcentajes  obtenidos  en  el  inciso  c),  ,'c6mo 
se  comparan  con  los  datos  por  la  Regia  empfrica? 
Explique. 

e.  /  Cuantos  de  los  paquetes  pesan  exactamente  1  libra? 

£ Puede  usted  considerar  alguna  explication  para  esto? 


2.25  Ritmo  respiratorio  <',Es  normal  el  ritmo 
respiratorio  de  usted?  En  realidad,  no  hay  un  ritmo 
estandar  de  respiration  para  seres  humanos.  Puede  variar 
desde  solo  cuatro  respiraciones  por  minuto  hasta  70  o 
75  para  una  persona  que  realice  un  ejercicio  agotador. 
Suponga  que  los  ritmos  respiratorios  en  reposo  para 
estudiantes  universitarios  tienen  una  distribution  de 
frecuencia  relativa  en  forma  de  montfculo,  con  una  media 
igual  a  12  y  una  desviacion  estandar  de  2.3  respiraciones 
por  minuto.  ^Que  fraction  de  todos  los  estudiantes 
tendrfa  ritmos  respiratorios  en  los  siguientes  intervalos? 

a.  9.7  a  14.3  respiraciones  por  minuto 

b.  7.4  a  16.6  respiraciones  por  minuto 

c.  Mas  de  18.9  o  menos  de  5.1  respiraciones  por  minuto 

(^)datos  2.26  Muestras  de  mineral  Una  geologa 
recolecto  20  muestras  diferentes  de  mineral, 
todas  del  mismo  peso,  y  al  azar  las  dividio  en  dos  grupos. 
Ella  midio  el  contenido  de  titanio  (Ti)  de  las  muestras 
usando  dos  metodos  diferentes. 


Metodo  1 

Metodo 

2 

.011 

.013  .013 

.015 

.014 

.011 

.016 

.013 

.012 

.015 

.013 

.010  .013 

.011 

.012 

.012 

.017 

.013 

.014 

.015 

a.  Construya  graficas  de  tallo  y  hoja  para  los  dos  con- 
juntos  de  datos.  Visualmente  compare  sus  centres  y 
sus  rangos. 

b.  Calcule  las  medias  muestrales  y  desviaciones  estandar 
para  los  dos  conjuntos.  ^Los  valores  calculados 
confirman  las  conclusiones  visuales  de  usted  del 
inciso  a)? 

2.27  Mumeros  del  Seguro  Social  Los  datos  del 
ejercicio  1.70  (vease  el  conjunto  de  datos  EX0170), 
reproducidos  a  continuation,  muestran  el  ultimo  dfgito 
del  numero  del  Seguro  Social  para  un  grupo  de  70 
estudiantes. 


1 

6 

9 

1 

5 

9 

0 

2 

8 

4 

0 

7 

3 

4 

2 

3 

5 

8 

4 

2 

3 

2 

0 

0 

2 

1 

2 

7 

7 

4 

0 

0 

9 

9 

5 

3 

8 

4 

7 

4 

6 

6 

9 

0 

2 

6 

2 

9 

5 

8 

5 

1 

7 

7 

7 

8 

7 

5 

1 

8 

3 

4 

1 

9 

3 

8 

6 

6 

6 

6 

a.  Usted  encontro  en  el  ejercicio  1.70  que  la  distribution 
de  estos  datos  era  relativamente  “plana”,  con  cada 
valor  diferente  de  0  a  9  presentandose  con  casi  igual 
frecuencia.  Usando  este  dato,  ^cual  serfa  su  mejor 
estimation  para  la  media  del  conjunto  de  datos? 

b.  Use  la  aproximacion  de  rango  para  calcular  el  valor  de 
s  para  este  conjunto. 

c.  Use  su  calculadora  para  hallar  los  valores  reales  de  x  y  s. 
Compare  con  sus  estimaciones  en  los  incisos  a)  y  b). 
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2.28  Numeros  del  Seguro  Social,  continua  Consulte 
el  conjunto  de  datos  del  ejercicio  2.27. 

a.  Encuentre  el  porcentaje  de  mediciones  en  los 
intervalos  x  ±  s,  x  ±  2s  y  x  ±  3s. 

b.  ^Como  se  comparan  los  porcentajes  obtenidos  en  el 
inciso  a)  con  los  dados  por  la  Regia  empfrica?  (\Dcben 
ser  aproximadamente  iguales?  Explique. 

2.29  Tiempos  de  supervivencia  Un  grupo  de  animales 
experimentales  es  infectado  con  una  forma  particular  de 
bacterias,  encontrandose  que  su  tiempo  de  supervivencia 
es  de  32  dfas  con  una  desviacion  estandar  de  36  dfas. 


c.  Calcule  .v  para  los  datos.  Construya  los  intervalos 
x  ±  s,x  ±  2s  y  x  ±  3s.  Calcule  el  porcentaje  de 
cuadrados  que  caen  en  cada  uno  de  los  tres  intervalos 
y  compare  con  los  correspondientes  porcentajes  dados 
por  la  Regia  empfrica  y  el  teorema  de  Chebyshev. 

2.32  Atunes,  otra  vez  Consulte  el  ejercicio  2.8  y  el 
conjunto  de  datos  EX0208.  A  continuacion  aparecen 
los  precios  de  una  lata  de  6  onzas,  o  una  bolsa  de  7.06 
onzas,  para  14  marcas  diferentes  de  atun  claro  elaborado 
en  agua  basados  en  precios  pagados  nacionalmente  en 
supermercados.4 


a.  Visualice  la  distribucion  de  tiempos  de  supervivencia. 
^Piensa  usted  que  la  distribucion  es  de  forma 
relativamente  de  montfculo,  sesgada  a  la  derecha  o 
sesgada  a  la  izquierda?  Explique. 

b.  ('.Dentro  de  que  lfmites  esperarfa  usted  que  se 
encuentren  al  menos  3/4  de  las  mediciones? 


2.30  Tiempos  de  supervivencia,  continua  Consulte 
el  ejercicio  2.29.  Puede  usar  la  Regia  empfrica  para  ver 
por  que  la  distribucion  de  tiempos  de  supervivencia 
no  podrfa  tener  forma  de  montfculo. 

a.  Encuentre  el  valor  de  x  que  sea  exactamente  una 
desviacion  estandar  debajo  de  la  media. 

b.  Si  la  distribucion  tiene  en  realidad  forma  de 
montfculo,  £  aproximadamente  que  porcentaje 

de  las  mediciones  debe  ser  menor  que  el  valor  de 
x  encontrado  en  el  inciso  a)? 

c.  Como  la  variable  que  se  mide  es  tiempo,  yes  posible 
haya  algunas  mediciones  que  esten  mas  de  una 
desviacion  estandar  debajo  de  la  media? 

d.  Use  sus  respuestas  a  los  incisos  b)  y  c)  para  explicar 
por  que  la  distribucion  de  datos  no  puede  tener  forma 
de  montfculo. 

(^)  datos  2.31  Terreno  maderero  Para  calcular  la 

cantidad  de  madera  en  un  terreno  maderero,  un 
propietario  determino  contar  el  numero  de  arboles  con 
diametros  mayores  a  12  pulgadas  en  cuadrados  de  50  X 
50  pies  seleccionados  al  azar.  Se  escogieron  70  de  estos 
cuadrados  y  se  contaron  los  arboles  seleccionados  de 
cada  extension.  Los  datos  aparecen  en  seguida: 


7 

9 

3 

10 

9 

6 

10 


8  9  10 

8  7  9 

5  8  8 

7  7  7 

9  6  8 

7  9  13 

5  9  8 


a.  Construya  un  histograma  de  frecuencia  relativa  para 
describir  los  datos. 

b.  Calcule  la  media  muestral  x  como  estimacion  de  /x,  el 
numero  medio  de  arboles  para  todos  los  cuadrados  de 
50  X  50  pies  del  terreno. 


.99  1.92  1.23  .85  .65  .53  1.41 

1.12  .63  .67  .69  .60  .60  .66 

a.  Use  la  aproximacion  de  rango  para  hallar  una 
estimacion  de  s. 

b.  ('Como  se  compara  con  el  valor  calculado  de  .v? 

datos  2.33  viejo  fiel  Los  datos  siguientes  son  30 
tiempos  de  espera  entre  erupciones  del  geiser 
Old  Faithful  del  parque  nacional  de  Yellowstone.8 

56  89  51  79  58  82  52  88  52  78  69  75  77  72  71 

55  87  53  85  61  93  54  76  80  81  59  86  78  71  77 

a.  Calcule  el  rango. 

b.  Use  la  aproximacion  de  rango  para  aproximar  la 
desviacion  estandar  de  estas  30  mediciones. 

c.  Calcule  la  desviacion  estandar  de  la  muestra  s. 

d.  i Que  proportion  de  las  mediciones  se  encuentra  a  no 
mas  de  dos  desviaciones  estandar  de  la  media?  y  Y 

a  no  mas  de  tres  desviaciones  estandar  de  la  media? 
yEstas  proporciones  concuerdan  con  las  proporciones 
dadas  en  el  teorema  de  Chebyshev? 

(^)datos  2.34  Hijos  del  presidente  Latabla 
EX0234  siguiente  muestra  los  nombres  de  los  42 
presidentes  de  Estados  Unidos,  junto  con  el  numero  de 
sus  hijos.2 


Washington 

0 

Van  Buren 

4 

Buchanan 

0 

Adams 

5 

W.H.  Harrison 

10 

Lincoln 

4 

Jefferson 

6 

Tyler* 

15 

A.  Johnson 

5 

Madison 

0 

Polk 

0 

Grant 

4 

Monroe 

2 

Taylor 

6 

Hayes 

8 

J.Q.  Adams 

4 

Fillmore* 

2 

Garfield 

7 

Jackson 

0 

Pierce 

3 

Arthur 

3 

Cleveland 

5 

Coolidge 

2 

Nixon 

2 

B.  Harrison* 

3 

Hoover 

2 

Ford 

4 

McKinley 

2 

F.D.  Roosevelt 

6 

Carter 

4 

T.  Roosevelt* 

6 

Truman 

1 

Reagan* 

4 

Taft 

3 

Eisenhower 

2 

G.H.W.  Bush 

6 

Wilson* 

3 

Kennedy 

3 

Clinton 

1 

Harding 

0 

L.B.  Johnson 

2 

G.W.  Bush 

2 

*  Casado  dos  veces  Fuente:  Time  Almanac  2007 
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a.  Construya  un  histograma  de  frecuencia  relativa  para 
describir  los  datos.  7,  Como  describirfa  usted  la  forma 
de  esta  distribucion? 

b.  Calcule  la  media  y  la  desviacion  estandar  para  el 
conjunto  de  datos. 

c.  Construya  los  intervalos  x  ±  s,  x  ±  2s  y  x  ±  3s. 
Encuentre  el  porcentaje  de  mediciones  que 
caen  en  estos  tres  intervalos  y  compare  con  los 
correspondientes  porcentajes  dados  por  el  teorema  de 
Chebyshev  y  la  Regia  emplrica. 

2.35  Un  hallazgo  arqueologico,  otra  vez  Consulte 
el  ejercicio  2.17.  El  porcentaje  de  oxido  de  hierro  en  cada 
una  de  cinco  muestras  de  ceramica  recolectadas  en  el 
sitio  de  Island  Thorns  fue: 

1.28  2.39  1.50  1.88  1.51 

a.  Use  la  aproximacion  de  rango  para  hallar  una 
estimacion  de  s,  usando  un  divisor  apropiado  de  la 
tabla  2.6. 

b.  Calcule  la  desviacion  estandar  ,v.  (',Que  tan  cerca 
estuvo  su  estimacion  respecto  del  valor  real  de  si 

datos  2.36  Brett  Favre  El  numero  de  pases 

completados  por  Brett  Favre,  mariscal  de  campo 
de  los  Empacadores  de  Green  Bay,  se  registro  en  cada 
uno  de  los  16  juegos  regulares  de  la  temporada  de  verano 
de  2006  (www.espn.com)9. 

15  31  25  22  22  19 

17  28  24  5  22  24 

22  20  26  21 

a.  Trace  una  grafica  de  tallo  y  hoja  para  describir  los 
datos. 

b.  Calcule  la  media  y  desviacion  estandar  para  los  pases 
completados  por  juego  de  Brett  Favre. 

c.  7,Que  proportion  de  las  mediciones  esta  a  no  mas  de 
dos  desviaciones  estandar  de  la  media? 

cAlculo  de  la  media 

Y  DESVIACION  ESTANDAR  PARA 
DATOS  AGRUPADOS  (OPCIONAL) 

2.37  Suponga  que  algunas  mediciones  se  presentan  mas 
de  una  vez  y  que  los  datos  xu  x2,  . . .,  xk  estan  dispuestos 
en  una  tabla  de  frecuencia  como  vemos  aquf: 


Las  formulas  para  la  media  y  varianza  para  datos 
agrupados  son 


x  =JiM, 


n 


donde  n  =  Xf 


y 


s 


2 


n 


n  —  1 


Observe  que  si  cada  uno  de  los  valores  se  presenta  una 
vez,  estas  formulas  se  reducen  a  las  dadas  en  el  texto. 

Aun  cuando  estas  formulas  para  datos  agrupados  son 
basicamente  de  valor  cuando  tenemos  un  gran  numero  de 
mediciones,  demuestre  su  uso  para  la  muestra  1,  0,  0,  1, 

3,  1,3,2,  3,0,  0,  1,  1,3,2. 

a.  Calcule  x  y  s2  directamente,  usando  las  formulas  para 
datos  no  agrupados. 

b.  La  tabla  de  frecuencia  para  las  n  =  15  mediciones  es 
como  sigue: 

x _ f 

0  4 

1  5 

2  2 

3  4 

Calcule  xys2  usando  las  formulas  para  datos  agrupados. 
Compare  con  sus  respuestas  al  inciso  a). 

2.38  International  Baccalaureate  El  programa 
International  Baccalaureate  (IB)  es  un  programa 
academico  acelerado  ofrecido  a  un  creciente  numero  de 
secundarias  en  todo  el  pais.  Los  estudiantes  inscritos 
en  este  programa  participan  en  cursos  acelerados  o 
avanzados  y  deben  tomar  examenes  IB  en  cada  una  de 
las  seis  materias  al  terminar  su  penultimo  o  ultimo  ano. 
Los  estudiantes  son  calificados  en  una  escala  de  1-7,  con 
1-2  siendo  malo,  3  mediocre,  4  promedio  y  5-7  excelente. 
Durante  su  primer  ano  de  operation  en  la  secundaria 
John  W.  North  en  Riverside,  California,  17  estudiantes 
de  penultimo  ano  trataron  de  pasar  el  examen  IB  de 
economfa,  con  estos  resultados: 


Observaciones  Frecuencia  ( 


*i  f 

Xl  fl 


xk 


f* 


Calificacion  de  examen 

7 

6 

5 

4 

3 


Numero  de  estudiantes 
1 

4 

4 

4 

4 
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Calcule  la  media  y  desviacion  estandar  para  estas 
calificaciones. 

2.39  Una  distribucion  sesgada  Para  ilustrar  la 
utilidad  de  la  Regia  empirica,  considere  una  distribucion 
que  esta  fuertemente  sesgada  a  la  derecha,  como  se 
muestra  en  la  figura  siguiente. 

a.  Calcule xy  s  para los  datos  mostrados.  (nota:  Hay  10 
ceros,  cinco  unos,  y  asf  sucesivamente.) 

b.  Construya  los  intervalos  x  ±  s,  x  ±  2s  y  x  ±  3s  y 
localicelos  en  la  distribucion  de  frecuencia. 

c.  Calcule  la  proporcion  de  las  n  =  25  mediciones  que 
caen  en  cada  uno  de  tres  intervalos.  Compare  con  el 
teorema  de  Chebyshev  y  la  Regia  empirica.  Observe 
que,  aun  cuando  la  proporcion  que  cae  en  el  intervalo 
x  ±  s  no  concuerda  cercanamente  con  la  Regia 
empirica,  las  proporciones  que  caen  en  los  intervalos 
x  ±  2s  y  x  ±  3.v  concuerdan  muy  bien.  Muchas  veces 


esto  es  cierto,  aun  para  distribuciones  de  datos  que  no 
tengan  forma  de  monticulo. 


Distribucion  para  el  ejercicio  2.39 


MEDICIONES  DE  POSICION  RELATIVA 


A  veces  es  necesario  conocer  la  posicion  de  una  observation  respecto  a  otras  de  un 
conjunto  de  datos.  Por  ejemplo,  si  usted  se  examina  con  un  total  de  35  puntos,  podrfa 
desear  saber  como  se  compara  su  calificacion  de  30  con  las  calificaciones  de  los  otros 
estudiantes  del  grupo.  La  media  y  desviacion  estandar  de  las  calificaciones  se  pueden 
usar  para  calcular  un  puntaje  z,  que  mide  la  posicion  relativa  de  una  medicion  en  un 
conjunto  de  datos. 


Definicion  El  puntaje  z  muestral  es  una  medida  de  posicion  relativa  definida 
por 


CONSEJO 


puntaje  z  =  — 


Puntaje  zpositivo  <=>  x 
esta  arriba  de  la  media. 
Puntaje  z  negativo  <=>  x esta 
debajo  de  la  media. 


Un  puntaje  z  mide  la  distancia  entre  una  observacion  y  la  media,  medidas  en  uni- 
dades  de  desviacion  estandar.  Por  ejemplo,  suponga  que  la  media  y  desviacion  estan¬ 
dar  de  los  puntajes  de  examen  (basados  en  un  total  de  35  puntos)  son  25  y  4,  respectiva- 
mente.  El  puntaje  z  para  su  calificacion  de  30  se  calcula  como  sigue: 


.  •  x  —  x  30  —  25  , 

puntaje  z  =  — ~  = - ^ - =  1 .25 

Su  puntaje  de  30  esta  a  1.25  desviaciones  estandar  arriba  de  la  media  (30  =  x  + 
1.25  s). 
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El  puntaje  z  es  una  valiosa  herramienta  para  determinar  si  es  probable  que  una  obser¬ 
vation  particular  se  presente  con  frecuencia,  o  si  es  improbable  y  puede  ser  considerada 
como  resultado  atipico. 


De  acuerdo  con  el  teorema  de  Chebyshev  y  la  Regia  empirica, 

•  al  menos  75%  y  mas  probablemente  95%  de  las  observaciones  estan  a  no  mas  de 
dos  desviaciones  estandar  de  su  media:  sus  puntajes  z  estan  entre  —2  y  +2.  Las 
observaciones  con  puntajes  z  mayores  a  2  en  valor  absoluto  se  presentan  menos 
del  5%  del  tiempo  y  son  consideradas  un  tanto  improbables. 

•  al  menos  89%  y  mas  probablemente  99.7%  de  las  observaciones  estan  a  no  mas 
de  tres  desviaciones  estandar  de  su  media:  sus  puntajes  z  estan  entre  —  3  y  +3. 
Las  observaciones  con  puntajes  z  mayores  a  3  en  valor  absoluto  se  presentan 
menos  del  1%  del  tiempo  y  son  consideradas  muy  poco  probables. 


Los  puntajes  zmayores 
a  3  en  valor  absoluto  son  muy 
poco  comunes. 


EJEMPLO 


Usted  debe  apreciar  con  cuidado  cualquier  observacion  que  tenga  un  puntaje  z  mayor  a 
3  en  valor  absoluto.  Quiza  la  medicion  fue  registrada  incorrectamente  o  no  pertenece  a 
la  poblacion  que  se  muestrea.  Quiza  es  solo  una  observacion  muy  poco  probable,  pero 
valida,  con  todo. 

Considere  esta  muestra  de  n  mediciones: 

1,  1,0,  15,2,  3,4,  0,  1,3 


La  medicion  x  =  15  parece  ser  extraordinariamente  grande.  Calcule  el  puntaje  z  para 
esta  observacion  y  exprese  sus  conclusiones. 

Calcule  x  =  3.0  y  s  =  4.42  para  las  n  =  10  mediciones.  Entonces  el  pun¬ 
taje  z  para  el  resultado  atipico  sospechoso,  x  =  15,  se  calcula  como 


puntaje  z  =  -I _ -I  =  J-5 _ 4 

F  J  s  4.42 


2.71 


En  consecuencia,  la  medicion  x  =  15  esta  2.71  desviaciones  estandar  arriba  de  la  media 
muestral,  x  =  3.0.  Aun  cuando  el  puntaje  z  no  excede  de  3,  esta  cercano  lo  suficiente 
para  que  usted  pueda  sospechar  que  x  =  15  es  un  resultado  atipico.  Usted  debe  examinar 
el  procedimiento  de  muestreo  para  ver  si  x  =  15  es  una  observacion  defectuosa. 


Un  percentil  es  otra  medida  de  position  relativa  y  se  usa  con  mas  frecuencia  para 
conjuntos  grandes  de  datos.  (Los  percentiles  no  son  muy  utiles  para  conjuntos  pequenos 
de  datos.) 


Definicion  Un  conjunto  de  n  mediciones  de  la  variable  x  se  ha  reacomodado  en 
orden  de  magnitud.  El  /7-esimo  percentil  es  el  valor  de  x  que  es  mayor  a  p%  de  las 
mediciones  y  es  menor  que  el  restante  (100  —  p)%. 


Supongamos  que  usted  ha  sido  notificado  que  su  calificacion  de  610,  en  el  Examen 
verbal  de  graduation,  lo  ha  colocado  en  el  60avo  percentil  en  la  distribution  de  califi- 
caciones.  ^Donde  esta  su  calificacion  de  610  en  relation  a  las  calificaciones  de  los  otros 
que  tomaron  el  examen? 

Solucion  Calificar  en  el  60avo  percentil  significa  que  60%  de  todas  las  calificacio¬ 
nes  de  examen  fueron  mas  bajas  que  la  calificacion  de  usted  y  40%  fueron  mas  altas. 
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En  general,  el  60avo  percentil  para  la  variable  x  es  un  punto  en  el  eje  horizontal  de 
la  distribucion  de  datos  que  es  mayor  a  60%  de  las  mediciones  y  menor  que  las  otras. 
Esto  es,  60%  de  las  mediciones  son  menores  que  el  60avo  percentil  y  40%  son  mayores 
(vease  la  figura  2.14).  Como  el  area  total  bajo  la  distribucion  es  100%,  60%  del  area  esta 
a  la  izquierda  y  40%  del  area  esta  a  la  derecha  del  60avo  percentil.  Recuerde  que  la  me- 
diana,  m,  de  un  conjunto  de  datos  es  la  medicion  central;  esto  es,  50%  de  las  medicio¬ 
nes  son  mas  pequenas  y  50%  son  mas  grandes  que  la  mediana.  Entonces,  jla  mediana 
es  igual  que  el  50avo  percentil! 


FIGURA  2.14 

El  BOavo  percentil  mostrado 
en  el  histograma  de  frecuencia 
relativa  para  un  conjunto  de 
datos 


60avo  percentil 


Los  percentiles  25avo  y  75avo,  llamados  cuartiles  inferior  y  superior,  junto  con  la 
mediana  (el  50avo  percentil),  localizan  puntos  que  dividen  los  datos  en  cuatro  conjun- 
tos,  cada  uno  conteniendo  un  numero  igual  de  mediciones.  Veinticinco  por  ciento  de  las 
mediciones  seran  menores  que  el  cuartil  inferior  (primero),  50%  seran  menores  que  la  me¬ 
diana  (el  segundo  cuartil)  y  75%  seran  menores  que  el  cuartil  superior  (tercero).  De  este 
modo,  la  mediana  y  los  cuartiles  inferior  y  superior  estan  ubicados  en  puntos  en  el  eje  x 
de  modo  que  el  area  bajo  el  histograma  de  frecuencia  relativa  para  los  datos  esta  dividida 
en  cuatro  areas  iguales,  como  se  muestra  en  la  figura  2.15. 


FIGURA  2.1  5 

Ubicacion  de  cuartiles 


B. 


25% 

25% 

25% 

25% 

Mediana,  m 

1  X 

Cuartil  inferior,  Q{  Cuartil  superior, 
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E  J  E  M  P  L 


Definicion  Un  conjunto  de  n  mediciones  en  la  variable  x  se  ha  acomodado  en  orden 
de  magnitud.  El  cuartil  inferior  (primer  cuartil),  Qx,  es  el  valor  de  x  que  es  mayor  a  un 
cuarto  de  las  mediciones  y  es  menor  que  los  restantes  tres  cuartos.  El  segundo  cuartil  es 
la  mediana.  El  cuartil  superior  (tercer  cuartil),  Q3,  es  el  valor  de  x  que  es  mayor  a  tres 
cuartos  de  las  mediciones  y  es  menor  que  el  restante  un  cuarto. 


Para  conjuntos  de  datos  pequenos,  con  frecuencia  es  imposible  dividir  el  conjunto 
en  cuatro  grupos,  cada  uno  de  los  cuales  contiene  exactamente  25%  de  las  mediciones. 
Por  ejemplo,  cuando  n  =  10,  usted  necesita  tener  2 Vi  mediciones  en  cada  grupo.  Aun 
cuando  usted  efectue  esta  tarea  (por  ejemplo,  si  n  =  12),  hay  muchos  numeros  que  satis- 
farfan  la  definicion  precedente  y,  por  lo  tanto,  podrian  ser  considerados  “cuartiles”.  Para 
evitar  esta  ambigtiedad,  usamos  la  siguiente  regia  para  localizar  cuartiles  muestrales. 


cAlculo  de  cuartiles  muestrales 


•  Cuando  las  mediciones  estan  dispuestas  en  orden  de  magnitud,  el  cuartil  infe¬ 
rior,  Qu  es  el  valor  de  x  en  la  posicion  ,25(/z  +  1),  y  el  cuartil  superior,  Q},  es 
el  valor  de  x  en  la  posicion  .75(n  +1). 

•  Cuando  .25 (n  +  1)  y  .75 (n  +  1)  no  son  enteros,  los  cuartiles  se  encuentran  por 
interpolation,  usando  los  valores  de  las  dos  posiciones  adyacentes.' 

Encuentre  los  cuartiles  inferior  y  superior  para  este  conjunto  de  mediciones: 

16,  25,4,  18,  11,  13,  20,8,  11,9 


Ordene  las  n  =  10  mediciones  de  menor  a  mayor: 


4,8,9,  11,  11,  13,  16,  18,20,25 


Calcule 


Posicion  de  Ql  =  25{n  +  1)  =  .25(10  +  1)  =  2.75 
Posicion  de  Q3  =  .75 (n  +  1)  =  .75(10  +  1)  =  8.25 

Como  estas  posiciones  no  son  enteros,  el  cuartil  inferior  se  toma  como  el  valor  3/4  de  la 
distancia  entre  la  segunda  y  tercera  mediciones  ordenadas,  y  el  cuartil  superior  se  toma 
como  el  valor  1/4  de  la  distancia  entre  la  octava  y  novena  mediciones  ordenadas.  Por 
tanto, 

Ql  =  8  +  .75(9  -  8)  =  8  +  .75  =  8.75 


y 

Q3  =  18  +  .25(20  -  18)  =  18  +  .5  =  18.5 


Como  la  mediana  y  los  cuartiles  dividen  la  distribucion  de  datos  en  cuatro  partes, 
cada  una  de  ellas  conteniendo  alrededor  de  25%  de  las  mediciones,  <2i  y  Qt,  son  las  fron- 
teras  superior  e  inferior  para  el  50%  central  de  la  distribucion.  Podemos  medir  el  ran- 
go  de  este  “50%  central”  de  la  distribucion  usando  una  medida  numerica  llamada  rango 
intercuartil. 


f  Esta  definicion  de  cuartiles  es  consistente  con  la  empleada  en  el  paquete  MINITAB.  Algunos  libros  de  texto  em- 
plean  redondeo  ordinario  cuando  buscan  posiciones  de  cuartil,  mientras  que  otros  calculan  cuartiles  muestrales 
como  las  medianas  de  las  mitades  superior  e  inferior  del  conjunto  de  datos. 
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Definicion  El  rango  intercuartil  (IQR)  para  un  conjunto  de  mediciones  es  la  dife- 
rencia  entre  los  cuartiles  superior  e  inferior;  esto  es,  IQR  =  Q3  —  Q\. 


Para  los  datos  del  ejemplo  2.13,  IQR  =  Q3  —  Qx  =  18.50  —  8.75  =  9.75.  Usaremos  el 
IQR  junto  con  los  cuartiles  y  la  mediana  en  la  siguiente  seccion  para  construir  otra  gra- 
fica  para  describir  conjuntos  de  datos. 


1 .  Acomode  el  conjunto  de  datos  en  orden  de  magnitud  de  menor  a  mayor. 

2.  Calcule  las  posiciones  de  cuartil: 

•  Posicion  de  Q{.  .25 (n  +  1) 

•  Posicion  de  Q3:  .75 (n  +  1) 

3.  Si  las  posiciones  son  de  enteros,  entonces  Q,  y  Q-,  son  los  valores  del  conjunto 
ordenado  de  datos  que  se  encuentra  en  esas  posiciones. 

4.  Si  las  posiciones  del  paso  2  no  son  de  enteros,  encuentre  las  dos  mediciones  en 
las  posiciones  un  poco  arriba  y  un  poco  debajo  de  la  posicion  calculada.  Calcu¬ 
le  el  cuartil  al  hallar  un  valor  ya  sea  de  un  cuarto,  un  medio  y  tres  cuartos  de  la 
distancia  entre  estas  dos  mediciones. 

Repertorio  de  ejercicios 

A.  A  continuacion  encontrara  dos  conjuntos  de  datos  de  practica.  Llene  los  espacios 
en  bianco  para  hallar  los  cuartiles  necesarios.  El  primer  conjunto  de  datos  ya  esta 
hecho. 


Conjunto  de  datos 

Ordenado 

n 

Posicion 

de  4 

Posicion 

de  Q3 

Cuartil 

inferior,  fi, 

Cuartil 
superior,  Q3 

2,  5,7, 1,1, 2, 8 

1, 1,2,  2,  5,  7,8 

7 

2o 

1 

1 

5,  0,1,3, 1,5,5, 2,  4,  4,1 

B.  A  continuacion  encontrara  tres  conjuntos  de  datos  que  ha  estan  ordenados.  Las 
posiciones  de  los  cuartiles  superior  e  inferior  se  muestran  en  la  tabla.  Encuentre 
las  mediciones  un  poco  arriba  y  un  poco  debajo  de  la  posicion  de  cuartil.  Ense- 
guida  encuentre  los  cuartiles  superior  e  inferior.  El  primer  conjunto  de  datos  ya 
esta  hecho. 


Conjunto  ordenado 
de  datos 

Posicion 

de  Qy 

Mediciones 

arriba  y  abajo 

Q, 

Posicion 

de  Q3 

Mediciones 

arriba  y  abajo 

q3 

0,1,4, 4,  5,9 

1.75 

0  y  1 

0  +  .75(1)  = 
.75 

5.25 

5  y  9 

5  +  .25(4) 

=  6 

0,1, 3, 3, 4, 7,7,8 

2.25 

y 

6.75 

V 

1,1,2,  5, 6, 6, 7,  9,9 

2.5 

y 

7.5 

V 

Informe  de  progreso 

•  ('  T odavfa  tiene  problemas?  Intente  de  nuevo  usando  el  Repertorio  de  ejerci¬ 
cios  del  final  de  esta  seccion. 

•  (',Ya  domina  los  cuartiles  muestrales?  Puede  saltarse  el  Repertorio  de  ejerci¬ 
cios  del  final  de  esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 
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CAPiTULO  2  DESCRIPCION  DE  DATOS  CON  MEDIDAS  NUMERICAS 


Muchas  de  las  medidas  numericas  que  usted  ha  aprendido  se  encuentran  facilmente 
usando  programas  de  computo  o  incluso  calculadoras  graficadoras.  El  comando  MINITAB 
Stat  — »  Basic  Statistics  —>  Display  Descriptive  Statistics  (vease  la  section  “Mi  MINI¬ 
TAB”  al  final  de  este  capitulo)  produce  una  salida  que  contiene  la  media,  la  desviacion 
estandar,  la  mediana  y  los  cuartiles  inferior  y  superior,  asi  como  los  valores  de  algunas 
otras  estadisticas  que  todavia  no  vemos.  Los  datos  del  ejemplo  2.13  produjeron  la  salida 
MINITAB  que  se  muestra  en  la  figura  2.16.  Observe  que  los  cuartiles  son  identicos  a  los 
valores  calculados  manualmente  en  ese  ejemplo. 


FIGURA  2.1  6 

Salida  MINITAB  para  los 
datos  del  ejemplo  2.13 


Estadistica  descriptiva:  x 

Variable  N  N*  Mean  SE  Mean  StDev  Minimum 

X  10  0  13.50  1.98  6.28  4.00 


Q1  Median 
8.75  12.00 


Q3  Maximum 
18.50  25.00 


EL  RESUMEN  DE  CINCO  NUMEROS 
Y  LA  GRAFICA  DE  CAJA 


La  mediana  y  los  cuartiles  superior  e  inferior  que  se  muestran  en  la  figura  2.15  dividen 
los  datos  en  cuatro  conjuntos,  cada  uno  de  los  cuales  contiene  igual  numero  de  medi- 
ciones.  Si  agregamos  el  numero  mas  grande  (Max)  y  el  numero  mas  pequeno  (Min)  del 
conjunto  de  datos  a  este  grupo,  tendremos  un  conjunto  de  numeros  que  da  un  rapido  y 
aproximado  resumen  de  la  distribucion  de  datos. 


El  resumen  de  cinco  numeros  consta  del  numero  mas  pequeno,  el  cuartil  inferior, 
le  mediana,  el  cuartil  superior,  y  el  numero  mas  grande,  presentados  en  orden  de 
menor  a  mayor: 

Min  gi  Mediana  Q3  Max 


Por  definition,  un  cuarto  de  las  mediciones  del  conjunto  de  datos  se  encuentre  entre 
cada  uno  de  los  cuatro  pares  adyacentes  de  numeros. 

El  resumen  de  cinco  numeros  se  puede  usar  para  crear  una  grafica  sencilla  llamada 
grafica  de  caja  a  fin  de  describir  visualmente  la  distribucion  de  datos.  De  la  grafica  de 
caja,  rapidamente  se  puede  detectar  cualquier  sesgo  en  la  forma  de  la  distribucion  y  ver 
si  hay  algunos  resultados  atipicos  en  el  conjunto  de  datos. 

Un  resultado  atipico  aparece  al  trasponer  digitos  cuando  se  registra  una  medicion,  al 
leer  incorrectamente  la  caratula  de  un  instrumento,  por  el  mal  funcionamiento  de  una 
pieza  de  equipo  o  por  otros  problemas.  Aun  cuando  no  haya  errores  de  registro  o  de 
observation,  un  conjunto  de  datos  puede  contener  una  o  mas  mediciones  validas  que, 
por  una  u  otra  razon,  difieren  marcadamente  de  las  otras  del  conjunto.  Estos  resultados 
atipicos  pueden  causar  una  notable  distorsion  en  medidas  numericas  de  uso  comun  tales 
como  x  y  s.  De  hecho,  los  atipicos  pueden  contener  information  importante  no  compar- 
tida  con  las  otras  mediciones  del  conjunto.  Por  tanto,  los  resultados  atipicos  aislados,  si 
estan  presentes,  son  un  paso  importante  en  cualquier  analisis  preliminar  de  un  conjunto 
de  datos.  La  grafica  de  caja  esta  disenada  expresamente  para  este  fin. 
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PARA  CONSTRUIR  UNA  GRAFICA  DE  CAJA 

•  Calcule  la  mediana,  los  cuartiles  superior  e  inferior  y  el  IQR  para  el  conjunto  de 
datos. 

•  Trace  una  recta  horizontal  que  represente  la  escala  de  medicion.  Forme  una  caja 
un  poco  arriba  de  la  recta  horizontal  con  los  extremos  derecho  e  izquierdo  en  <2i 
y  Q3.  Trace  una  recta  vertical  que  pase  por  la  caja  en  la  ubicacion  de  la  mediana. 

Una  grafica  de  caja  se  muestra  en  la  figura  2. 17. 


* 


t  "7  r 

Lfmite  Q{  m  Q3  Lfmite 

inferior  superior 

En  la  section  2.6,  el  puntaje  z  dio  fronteras  para  hallar  mediciones  extraordinaria- 
mente  grandes  o  pequenas.  Buscamos  puntajes  z  mayores  a  2  o  3  en  valor  absoluto.  La 
grafica  de  caja  usa  el  IQR  para  crear  “lfmites”  imaginarios  para  separar  resultados  atfpi- 
cos  del  resto  del  conjunto  de  datos: 

DETECCION  DE  RESULTADOS  ATIPICOS. 
OBSERVACIONES  QUE  ESTAN  A  MAYOR  DISTANCIA: 

•  Lfmite  inferior:  Q,  —  1.5(IQR) 

•  Lfmite  superior:  Q3  +  1.5  (IQR) 

Los  lfmites  superior  e  inferior  se  muestran  con  lfneas  interrumpidas  en  la  figura  2.17, 
pero  no  suelen  ser  trazadas  en  la  grafica  de  caja.  Cualquier  medicion  a  mayor  distancia 
del  lfmite  superior  o  inferior  es  un  resultado  atfpico;  el  resto  de  las  mediciones,  den- 
tro  de  los  lfmites,  no  son  inusuales.  Por  ultimo,  la  grafica  de  caja  marca  el  rango  del 
conjunto  de  datos  usando  “bigotes”  para  conectar  las  mediciones  mas  pequenas  y  mas 
grandes  ( excluyendo  resultados  atipicos)  a  la  caja. 

PARA  TERMINAR  LA  GRAFICA  DE  CAJA 

•  Marque  cualesquier  resultados  atipicos  con  un  asterisco  (*)  en  la  grafica. 

•  Prolongue  rectas  horizontales  llamadas  “bigotes”  desde  los  extremos  de  la  caja  a 
las  observaciones  mas  pequenas  y  mas  grandes  que  no  sean  resultados  atipicos. 

A  medida  que  los  consumidores  estadounidenses  tienen  mas  cuidado  con  los  alimentos 
que  consumen,  los  procesadores  de  alimentos  tratan  de  ser  competitivos  al  evitar  can- 
tidades  excesivas  de  grasa,  colesterol  y  sodio  en  los  alimentos  que  venden.  Los  datos 
siguientes  son  las  cantidades  de  sodio  por  rebanada  (en  miligramos)  para  cada  una  de 
ocho  marcas  de  queso  regular  estadounidense.  Construya  una  grafica  de  caja  para  los 
datos  y  busque  resultados  atipicos. 

340,  300,  520,  340,  320,  290,  260,  330 
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Las  n  =  8  mediciones  se  ordenan  primero  de  menor  a  mayor: 

260,  290,  300,  320,  330,  340,  340,  520 

Las  posiciones  de  la  mediana,  <2i  y  Q\  son 
.5  (n  +  1)  =  .5(9)  =  4.5 
.25(b  +  1)  =  .25(9)  =  2.25 
.75  (n  +  1)  =  .75(9)  =  6.75 

de  modo  que  m  =  (320  +  330)/2  =  325,  Qx  =  290  +  .25(10)  =  292.5  yg3  =  340.  El 
rango  intercuartil  se  calcula  como 

IQR  =  Q3  -  Q i  =  340  -  292.5  =  47.5 

Calcule  los  limites  superior  e  inferior: 

Limite  inferior:  292.5  —  1.5(47.5)  =  221.25 
Limite  superior:  340  +  1.5(47.5)  =  411.25 

El  valor  x  =  520,  una  marca  de  queso  que  contiene  520  miligramos  de  sodio,  es  el  unico 
resultado  atipico  que  se  encuentra  fuera  de  la  cerca  superior. 

La  grafica  de  caja  para  los  datos  se  muestra  en  la  figura  2.18.  El  resultado  atipico  esta 
marcado  con  un  asterisco  (*).  Una  vez  excluido  el  resultado  atipico,  encontramos  (del 
conjunto  ordenado  de  datos)  que  las  mediciones  mas  pequena  y  mas  grande  son  x  =  260 
y  x  =  340.  Estos  son  los  dos  valores  que  forman  los  bigotes.  Como  el  valor  x  =  340  es 
igual  que  Q3,  no  hay  bigote  en  el  lado  derecho  de  la  caja. 


FIGURA  2.1  8 

Grafica  de  caja  para  el 
ejemplo  2.14 


APPLET 

Ahora  seria  un  buen  momento  para  probar  el  applet  Building  a  Box  Plot  (Constru- 
yendo  una  grafica  de  caja).  El  applet  de  la  figura  2.19  muestra  una  grafica  de  puntos 
de  los  datos  del  ejemplo  2.14.  Usando  el  boton  EUSB:  se  muestra  una  des- 

cripcion  paso  a  paso  que  explica  como  se  construye  la  grafica  de  caja.  Usaremos  este 
applet  otra  vez  para  Ejercicios  de  Mi  Applet  al  final  del  capitulo. 
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FIGURA  2.1  9 

Applet  Building  a  Box 
Plot 


Usted  puede  usar  la  grafica  de  caja  para  describir  la  forma  de  una  distribution  de 
datos  al  ver  la  position  de  la  recta  mediana  comparada  contra  Qx  y  Q3,  asf  como  los 
extremos  izquierdo  y  derecho  de  la  caja.  Si  la  mediana  esta  cerca  del  centro  de  la  caja, 
la  distribution  es  mas  o  menos  simetrica,  dando  asf  intervalos  de  igual  tamano  para 
contener  los  dos  cuartos  centrales  de  los  datos.  Si  la  recta  mediana  esta  a  la  izquierda 
del  centro,  la  distribution  esta  sesgada  a  la  derecha;  si  la  mediana  esta  a  la  derecha  del 
centro,  la  distribution  esta  sesgada  a  la  izquierda.  Tambien,  para  casi  todas  las  distri- 
buciones  sesgadas,  el  bigote  en  el  lado  sesgado  de  la  caja  tiende  a  ser  mas  largo  que  el 
bigote  del  otro  lado. 

Empleamos  el  comando  MINITAB  Graph  — >  Boxplot  para  trazar  dos  graficas  de  caja, 
una  para  el  contenido  de  sodio  de  las  ocho  marcas  de  queso  del  ejemplo  2. 14  y  otra  para 
cinco  marcas  de  queso  sin  grasa  con  estos  contenidos  de  sodio: 

300,  300,  320,  290,  180 

Las  dos  graficas  de  caja  se  muestran  juntas  en  la  figura  2.20.  Veamos  el  bigote  largo  del 
lado  izquierdo  de  ambas  graficas  y  la  position  de  las  rectas  medianas.  Ambas  distribu- 
ciones  estan  sesgadas  a  la  izquierda;  esto  es,  hay  unas  pocas  mediciones  inusualmente 
pequenas.  No  obstante,  los  datos  regulares  del  queso  tambien  muestran  una  marca  (x  = 
520)  con  una  cantidad  de  sodio  extraordinariamente  grande.  En  general,  aparece  que 
el  contenido  de  sodio  de  las  marcas  sin  grasa  es  menor  que  la  de  las  marcas  regulares, 
pero  la  variabilidad  del  contenido  de  sodio  para  queso  regular  (excluyendo  el  resultado 
atfpico)  es  menor  que  la  de  las  marcas  sin  grasa. 
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© 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  relacionan  a  la  seccion  Mi  Entrenador  personal  de  la  pagina  79. 

2.40  A  continuacion  se  encuentran  dos  conjuntos  de  datos  de  practica.  Llene  los  espacios 
en  bianco  para  hallar  los  cuartiles  necesarios. 


Conjunto  de  datos 

Ordenado 

n 

Posicion  de  G, 

Posicion  de  Q3 

Cuartil  inferior,  G, 

Cuartil  superior,  03 

.13,  .76,  .34,  .88,  .21,. 16,  .28 

2.3, 1.0,  2.1,  6.5,  2.8,  8.8, 

1.7,  2.9,  4.4,  5.1, 2.0 

2.41  A  continuacion  se  encuentran  tres  conjuntos  de  datos  que  ya  han  sido  ordenados. 
Llene  los  espacios  en  bianco  para  hallar  los  cuartiles  superiores  e  inferiores. 


Conjunto  ordenado 
de  datos 

Posicion  de  G , 

Mediciones 
arriba  y  abajo 

0, 

Posicion  de  03 

Mediciones 
arriba  y  abajo 

o3 

1,1.5,  2,  2,  2.2 

V 

y 

0, 1.7, 1.8,  3.1, 3.2, 

7,  8,  8.8,  8.9,  9,10 

V 

y 

.23, .30, .35, .41, 

.56,  .58,  .76,  .80 

V 

y 

TECNICAS  BASICAS 

2.42  Dado  el  siguiente  conjunto  de  datos:  8,  7,  1,  4,  6,  6, 
4,  5,  7,  6,  3,  0 

a.  Encuentre  el  resumen  de  cinco  numeros  y  el  IQR. 

b.  Calcule  iyj. 

c.  Calcule  el  puntaje  z  para  las  observaciones 
mas  pequenas  y  mas  grandes.  ^Alguna  de  estas 
observaciones  es  muy  grande  o  muy  pequena? 

2.43  Encuentre  el  resumen  de  cinco  numeros  y  el  IQR 
para  estos  datos: 

19,  12,  16,  0,  14,  9,  6,  1,  12,  13,  10,  19,  7,  5,  8 

2.44  Construya  una  grafica  de  caja  para  estos  datos  e 
identifique  los  resultados  atfpicos: 

25,  22,  26,  23,  27,  26,  28,  18,  25,  24,  12 

2.45  Construya  una  grafica  de  caja  para  estos  datos  e 
identifique  los  resultados  atfpicos: 

3,  9,  10,  2,  6,  7,  5,  8,  6,  6,  4,  9,  22 


APLICACIONES 

2.46  Si  usted  califico  en  el  69avo  percentil  en  un  examen 
de  conocimientos,  ^como  se  compara  su  calificacion  con 
otras? 

datos  2.47  Concentracion  de  mercurio  en 

delfines  Los  cientfficos  del  medio  ambiente 
estan  cada  vez  mas  preocupados  por  la  acumulacion  de 
elementos  toxicos  en  mamfferos  marinos,  asf  como  en 
el  paso  de  esos  elementos  a  los  descendientes  de  esos 
animales.  El  delffn  de  franjas  ( Stenella  coeruleoalba), 
considerado  el  principal  depredador  en  la  cadena 
alimenticia  marina,  fue  objeto  de  este  estudio.  Las 
concentraciones  de  mercurio  (microgramos/gramo) 
en  los  hfgados  de  28  delfines  de  franjas  machos  fueron 
como  sigue: 


1.70 

183.00 

221.00 

286.00 

1.72 

168.00 

406.00 

315.00 

8.80 

218.00 

252.00 

241.00 

5.90 

180.00 

329.00 

397.00 

101.00 

264.00 

316.00 

209.00 

85.40 

481.00 

445.00 

314.00 

118.00 

485.00 

278.00 

318.00 
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a.  Calcule  el  resumen  de  cinco  numeros  para  los  datos. 

b.  Construya  una  grafica  de  caja  para  los  datos. 

c.  (',Hay  algun  resultado  atfpico? 

d.  Si  usted  supiera  que  los  primeros  cuatro  delfines 
teman  menos  de  tres  anos  de  edad,  en  tanto  que 
los  otros  teman  mas  de  ocho  anos  de  edad,  /esta 
informacion  ayudarfa  a  explicar  la  diferencia  en  la 
magnitud  de  esas  cuatro  observaciones?  Explique. 

2.48  3arne  para  hamburguesa  Los  pesos  (en  libras) 
de  los  27  paquetes  de  carne  molida  de  res  del  ejercicio 
2.24  (vease  el  conjunto  de  datos  EX0224)  aparecen  a 
continuacion,  en  orden  de  menor  a  mayor: 


.75 

.83 

r-- 

oo 

.89 

.89 

.89 

.93 

.96 

.96 

.97 

.98 

.99 

1.08 

1.08 

1.12 

1.12 

1.14 

1.14 

1.18 

1.18 

1.24 

1.28 

1.38 

1.41 

a.  Confirme  los  valores  de  la  media  y  desviacion 
estandar,  calculados  en  el  ejercicio  2.24  como 
x  =  1.05  y  .S'  =  .17. 

b.  Los  dos  paquetes  de  carne  mas  grandes  pesan  1.38 
y  1.41  libras.  ^Estos  dos  paquetes  son  inusualmente 
pesados?  Explique. 

c.  Construya  una  grafica  de  caja  para  los  pesos  de 
paquetes.  (.Que  nos  dice  la  posicion  de  la  recta 
mediana  y  la  longitud  de  los  bigotes  acerca  de  la 
forma  de  la  distribucion? 

(^Jdatos  2.49  Comparacion  de  mariscales  de  campo 

de  la  NFL  (iC6mo  se  compara  Brett  Favre, 
mariscal  de  campo  de  los  Empacadores  de  Green  Bay, 
con  Peyton  Manning,  mariscal  de  campo  de  los  Potros 
de  Indianapolis?  La  tabla  siguiente  muestra  el  numero  de 
pases  completos  de  cada  uno  de  estos  atletas  durante  la 
temporada  de  futbol  de  2006  de  la  NFL:'1 


Brett  Favre 

Peyton  Manning 

15 

17 

22 

25 

32 

25 

31 

28 

20 

26 

30 

29 

25 

24 

26 

14 

27 

21 

22 

5 

21 

21 

20 

22 

22 

22 

20 

14 

19 

24 

25 

21 

a.  Calcule  los  resumenes  de  cinco  numeros  para  el 
numero  de  pases  completos  de  Brett  Favre  y  de  Peyton 
Manning. 

b.  Construya  graficas  de  caja  para  los  dos  conjuntos 
de  datos.  ('.Hay  resultados  atfpicos?  (.Que  nos  dicen 
las  graficas  de  caja  acerca  de  las  formas  de  las  dos 
distribuciones? 

c.  Escriba  un  breve  parrafo  que  compare  el  numero 
de  pases  completos  para  los  dos  mariscales  de 
campo. 


2.50  Vetos  de  presidentes  El  conjunto  de  vetos 
de  presidentes  del  ejercicio  1 .47  y  el  conjunto  de  datos 
EX0147  aparece  a  continuacion,  junto  con  una  grafica 
de  caja  generada  por  MINITAB.  Use  la  grafica  de  caja 
para  describir  la  forma  de  la  distribucion  e  identifique 
cualesquier  resultados  atfpicos. 


Washington 

2 

B.  Harrison 

19 

J.  Adams 

0 

Cleveland 

42 

Jefferson 

0 

McKinley 

6 

Madison 

5 

T.  Roosevelt 

42 

Monroe 

1 

Taft 

30 

J.  Q.  Adams 

0 

Wilson 

33 

Jackson 

5 

Harding 

5 

Van  Buren 

0 

Coolidge 

20 

W.  H.  Harrison 

0 

Hoover 

21 

Tyler 

6 

F.  D.  Roosevelt 

372 

Polk 

2 

Truman 

180 

Taylor 

0 

Eisenhower 

73 

Fillmore 

0 

Kennedy 

12 

Pierce 

9 

L.  Johnson 

16 

Buchanan 

4 

Nixon 

26 

Lincoln 

2 

Ford 

48 

A.  Johnson 

21 

Carter 

13 

Grant 

45 

Reagan 

39 

Hayes 

12 

G.  H.W.  Bush 

29 

Garfield 

0 

Clinton 

36 

Arthur 

4 

G.W.  Bush 

1 

Cleveland 

304 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 


Grafica  de  caja  para  el  ejercicio  2.50 


2.51  Tiempos  de  supervivencia  Altman  y  Bland 
informan  de  tiempos  de  supervivencia  para  pacientes 
con  hepatitis  activa,  la  mitad  tratados  con  prednisona 
y  la  mitad  no  reciben  tratamiento.10  Los  tiempos  de 
supervivencia  (en  meses)  (ejercicio  1.73  y  EX0173) 
estan  adaptados  de  sus  datos  para  los  tratados  con 
prednisona. 
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8  127 

11  133 

52  139 

57  142 

65  144 

87  147 

93  148 

97  157 

109  162 

120  165 

a.  t,A1  ver  estos  datos,  se  puede  decir  si  es  mas  o  menos 

simetrica?  bien,  es  sesgada? 

b.  Calcule  la  media  y  mediana.  Use  estas  medidas  para 
determinar  si  los  datos  son  o  no  son  simetricos  o 
sesgados. 

c.  Trace  una  grafica  de  caja  para  describir  los  datos. 
Explique  por  que  la  grafica  de  caja  confirma  lo 
concluido  por  usted  en  el  inciso  b). 

datos  2.52  Estados  de  cuenta  por  consumo 
EX0252  electrico  en  el  sur  de  California, 

otra  vez  Los  estados  de  cuenta  mensuales  por  consumo 
electrico  para  una  familia  en  Riverside,  California,  se 
registraron  durante  12  meses  consecutivos  desde  enero 
2006: 


Mes 

Cantidad  ($) 

Mes 

Cantidad  ($) 

Enero 

$266.63 

Julio 

$306.55 

Febrero 

163.41 

Agosto 

335.48 

Marzo 

219.41 

Septiembre 

343.50 

Abril 

162.64 

Octubre 

226.80 

Mayo 

187.16 

Noviembre 

208.99 

Junio 

289.17 

Diciembre 

230.46 

a.  Construya  una  grafica  de  caja  para  los  costos 
mensuales  por  consumo  electrico. 

b.  ('  Que  nos  dice  la  grafica  de  caja  acerca  de  la 
distribucion  de  cosos  por  consumo  electrico  para  esta 
familia? 

2.53  £Que  es  normal?,  otra  vez  Consulte  el  ejercicio 
1.67  y  el  conjunto  de  datos  EX0167.  Ademas  de  la 
temperatura  corporal  en  grados  Fahrenheit  para 
las  130  personas,  los  datos  registran  el  genero  de  estas. 

A  continuacion  aparecen  graficas  de  caja  para  los  dos 
grupos,  hombres  y  mujeres:11 


Graficas  de  caja  para  el  ejercicio  2.53 


^Como  describiria  usted  las  similitudes  y  diferencias 
entre  temperaturas  en  hombres  y  mujeres  en  este 
conjunto  de  datos? 
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REPASO  DEL  CAPlTULO 


Conceptos  clave  y  formulas 

i.  Medidas  de  centro  de  una  distribucion 
de  datos 

1 .  Media  aritmetica  (media)  o  promedio 

a.  Poblacion:  p 

b.  Muestra  de  n  mediciones:  x  =  -jp- 

2.  Mediana;  position  de  la  mediana  =  .5  («  +  1) 

3.  Moda 

4.  La  mediana  puede  ser  preferida  a  la  media  si  los 
datos  son  altamente  sesgados. 

II.  Medidas  de  variabilidad 

1.  Rango:  R  =  maximo  —  minirno 

2.  Varianza 

a.  Poblacion  de  N  mediciones: 

2  l(Xi  -  pf 

a  = - 

N 

b.  Muestra  de  n  mediciones: 

„  2  _ 

2  X(x,.-d2  ~ir 

n  —  1  n  —  1 

3.  Desviacion  estandar 

a.  Poblacion:  a  =  V(? 

b.  Muestra:  s  =  V? 

4.  Una  aproximacion  burda  para  s  se  puede  calcular 
como  s  ~  R/4.  El  divisor  se  puede  ajustar 
dependiente  del  tamano  muestral. 

III.  Teorema  de  Chebyshev  y  la  Regia 
empfrica 

1.  Use  el  teorema  de  Chebyshev  para  cualquier 
conjunto  de  datos,  cualquiera  que  sea  su  forma  o 
tamano. 

a.  A1  menos  1  —  (1  He)  de  las  mediciones  se 
encuentra  a  no  mas  de  k  desviaciones  estandar 
de  la  media. 

b.  Este  es  solo  un  limite  inferior;  puede  haber 
mas  mediciones  en  el  intervalo. 

2.  La  Regia  empirica  se  puede  usar  solo  para 
conjuntos  de  datos  en  forma  relativa  de 


monticulo.  Aproximadamente  68%,  95%  y 
99.7%  de  las  mediciones  estan  a  no  mas  de  uno, 
dos  y  tres  desviaciones  estandar  de  la  media, 
respectivamente. 

IV.  Mediciones  de  posicion  relativa 

x  —  X 

1.  Puntaje  z  muestral:  z  =  - - 

2.  p-esimo  percentil;  p%  de  las  mediciones  son  mas 
pequenas  y  (100  —  p)%  son  mas  grandes. 

3.  Cuartil  inferior,  Qx  \  posicion  de  Q,  = 

.25  (n  +  1) 

4.  Cuartil  superior,  Q{:  posicion  de  Q  ,  = 

.75  (n  +  1) 

5.  Rango  intercuartil:  IQR  =  Q3  —  Qx 

V.  El  resumen  de  cinco  numeros 

y  graficas  de  caja 

1.  El  resumen  de  cinco  numeros: 

Min  Q j  Mediana  Q,  Max 

Un  cuarto  de  las  mediciones  del  conjunto  de  datos 
esta  entre  cada  uno  de  los  cuatro  pares  adyacentes 
de  numeros. 

2.  Se  usan  graficas  de  caja  para  detectar  resultados 
atipicos  y  formas  de  distribuciones. 

3-  Q\  y  Q,  forman  los  extremos  de  la  caja.  La  recta 
mediana  esta  en  el  interior  de  la  caja. 

4.  Se  usan  limites  superiores  e  inferiores  para  hallar 
resultados  atipicos,  observaciones  que  estan  fuera 
de  estas  cercas. 

a.  Limite  inferior;  Q,  —  1.5(IQR) 

b.  Limite  superior:  Q3  +  1.5(IQR) 

5.  Los  resultados  atipicos  estan  marcados  en  la 
grafica  de  caja  con  un  asterisco  (*). 

6.  Los  bigotes  estan  conectados  a  la  caja  desde  las 
observaciones  mas  pequena  y  mas  grande  que  no 
sean  resultados  atipicos. 

7.  Las  distribuciones  sesgadas  por  lo  general  tienen 
un  bigote  largo  en  la  direccion  del  sesgo  y  la  recta 
mediana  se  traza  alejdndose  de  la  direccion  del 
sesgo. 
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Medidas  numericas  descriptivas 


El  MINITAB  da  casi  todas  las  estadfsticas  descriptivas  basicas  presentadas  en  el  capf- 
tulo  2  usando  un  solo  comando  en  los  menus  descendentes.  Una  vez  que  usted  este  en 
el  escritorio  de  Windows,  de  un  doble  clic  en  el  icono  MINITAB  o  use  el  boton  Start  para 
iniciar  el  MINITAB. 

Practique  introduciendo  algunos  datos  en  la  ventana  Data,  dando  nombre  apropiado 
a  las  columnas  en  la  celda  gris  que  esta  un  poco  abajo  del  numero  de  columna.  Cuan- 
do  haya  terminado  de  introducir  sus  datos,  habra  creado  una  hoja  de  trabajo  MINITAB, 
que  se  puede  guardar  ya  sea  en  forma  individual  o  como  proyecto  MINITAB  para  uso 
future.  De  un  clic  en  File  — »  Save  Current  Worksheet  o  en  File  — >  Save  Project.  Ne- 
cesitara  aplicar  nombre  a  la  hoja  de  trabajo  (o  proyecto),  quiza  “datos  de  prueba”,  para 
que  pueda  recuperarla  mas  adelante. 

Los  datos  siguientes  son  las  longitudes  de  piso  (en  pulgadas)  detras  de  los  asientos 
segundo  y  tercero  de  nueve  minivans  diferentes:12 

Segundo  asiento:  62.0,  62.0,  64.5,  48.5,  57.5,  61.0,  45.5, 47.0,  33.0 

Tercer  asiento:  27.0,  27.0,  24.0,  16.5,  25.0,  27.5,  14.0,  18.5,  17.0 

Como  los  datos  contienen  dos  variables,  introducimos  las  dos  filas  de  numeros  en  las 
columnas  Cl  y  C2  de  la  hoja  de  trabajo  MINITAB y  les  damos  los  nombres  “2o  asiento” 
y  “3er  asiento”,  respectivamente.  Usando  los  menus  descendentes,  de  un  clic  en  Stat  —> 
Basic  Statistics  — »  Display  Descriptive  Statistics.  El  cuadro  de  dialogo  se  muestra  en 
la  figura  2.2 1 . 

FIGURA  2.21 


Ahora  de  un  clic  en  la  caja  de  Variables  y  seleccione  ambas  columnas  de  la  lista  de 
la  izquierda.  (Puede  dar  un  clic  en  la  opcion  Graphs  y  escoger  una  de  varias  graficas  si 
lo  desea.  Tambien  puede  dar  un  clic  en  la  opcion  Statistics  para  seleccionar  las  estadfs¬ 
ticas  que  desee  ver  en  pantalla.)  De  un  clic  en  OK.  En  la  ventana  Session  aparecera  una 
pantalla  de  estadfsticas  descriptivas  para  ambas  columnas  (vease  la  figura  2.22).  Puede 
imprimir  esta  salida  usando  File  — »  Print  Session  Window  si  lo  desea. 

Para  examinar  la  distribucion  de  las  dos  variables  y  buscar  resultados  atfpicos,  puede 
crear  graficas  de  caja  usando  el  comando  Graph  — »  Boxplot  —*■  One  Y  — »  Simple.  De 
un  clic  en  OK.  Seleccione  la  columna  de  mediciones  apropiada  del  cuadro  de  Dialogo 
(vease  la  figura  2.23).  Puede  cambiar  la  presentacion  de  la  grafica  de  caja  en  varias  for¬ 
mas.  Scale  — >  Axes  and  Ticks  le  permitiran  trasponer  los  ejes  y  orientar  la  grafica  de 
caja  en  sentido  horizontal,  cuando  aplique  un  puntaje  en  la  caja  “Transpose  value  and 
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category  scales”.  Multiple  Graphs  da  opciones  de  impresion  para  multiples  graficas 
de  caja.  Labels  permite  poner  notas,  titulos  y  notas  al  pie  en  la  grafica.  Si  ya  ha  introdu- 
cido  datos  en  la  hoja  de  trabajo  como  distribucion  de  frecuencia  (valores  en  una  colum- 
na,  frecuencias  en  otra),  las  Data  Options  permitiran  leer  los  datos  en  ese  formato.  La 
grafica  de  caja  para  las  longitudes  del  tercer  asiento  se  muestra  en  la  figura  2.24. 

Usted  puede  usar  los  comandos  de  MINITAB  del  capitulo  1  para  mostrar  graficas  de 
tallo  y  hojas  o  histogramas  para  las  dos  variables.  ^Cdrno  describirfa  las  similitudes  y  las 
diferencias  en  estos  dos  conjuntos  de  datos?  Guarde  esta  hoja  de  trabajo  en  un  archivo 
llamado  “Minivans”  antes  de  salir  de  MINITAB.  Volvera  a  usarlo  en  el  capitulo  3. 


FIGURA  2.23 


FIGURA  2.24 
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EJercicios  suplementarios 

datos  2.54  Pasas  El  numero  de  pasas  en  cada  una  de 
14  minicajas  (tamano  de  1/2  onza)  se  conto  para 
una  marca  generica  y  pasas  de  la  marca  Sunmaid.  Aqui' 
vemos  los  dos  conjuntos  de  datos: 


Marca  generica 

Sunmaid 

25 

26 

25 

28 

25 

29 

24 

24 

26 

28 

28 

27 

28 

24 

28 

22 

26 

27 

24 

25 

25 

28 

30 

27 

26 

26 

28 

24 

a.  u ales  son  la  media  y  desviacion  estandar  para  la 
marca  generica? 

b.  u ales  son  la  media  y  desviacion  estandar  para  la 
marca  Sunmaid? 

c.  Compare  los  centros  y  variabilidades  de  las 
dos  marcas  usando  los  resultados  de  los  incisos 
a)  y  b). 

2.55  Pasas,  continua  Consulte  el  ejercicio  2.54. 

a.  Encuentre  la  mediana,  los  cuartiles  superior  e 
inferior  y  el  IQR  para  cada  uno  de  los  dos  conjuntos 
de  datos. 

b.  Construya  dos  graficas  de  caja  en  la  misma  escala 
horizontal  para  comparar  los  dos  conjuntos  de  datos. 

c.  Trace  dos  graficas  de  tallo  y  hoja  para  describir  las 
formas  de  los  dos  conjuntos  de  datos.  ^Las  graficas  de 
caja  del  inciso  b)  verifican  estos  resultados? 

d.  Si  podemos  suponer  que  ninguna  de  las  cajas 
de  pasas  no  se  llena  bien  (es  decir,  todas  pesan 
aproximadamente  1/2  onza),  £que  dicen  los  resultados 
de  usted  acerca  del  numero  promedio  de  pasas  para  las 
dos  marcas? 

datos  2.56  felevidentes  El  numero  de  horas  de 
television  vistas  por  familia,  asf  como  las 
horas  de  mayor  audiencia,  son  dos  factores  que  afectan 
el  ingreso  por  publicidad  en  television.  Una  muestra 
aleatoria  de  25  familias  en  una  zona  particular  produjo 
las  siguientes  estimaciones  de  horas  vistas  por  familia: 


3.0 

6.0 

7.5 

15.0 

12.0 

6.5 

8.0 

4.0 

5.5 

6.0 

5.0 

12.0 

1.0 

3.5 

3.0 

7.5 

5.0 

10.0 

8.0 

3.5 

9.0 

2.0 

6.5 

1.0 

5.0 

a.  Busque  en  los  datos  y  use  el  rango  para  hallar  un  valor 
aproximado  de  s.  Use  este  valor  para  verificar  sus 
calculos  del  inciso  b). 

b.  Calcule  la  media  muestral  x  y  la  desviacion  estandar 
de  la  muestra  s.  Compare  s  con  el  valor  aproximado 
obtenido  en  el  inciso  a). 


c.  Encuentre  el  porcentaje  de  las  horas  de  television 
vistas  por  familia,  que  caiga  en  el  intervalo  x  ±  2s. 
Compare  con  el  correspondiente  porcentaje  dado  por 
la  Regia  empirica. 

2.57  Una  enfermedad  recurrente  Consulte  el 
ejercicio  1.26  y  el  conjunto  de  datos  EX0126.  Los 
tiempos  (en  meses)  entre  el  comienzo  de  una  enfermedad 
particular  y  su  recurrencia  se  registraron: 


2.1 

4.4 

2.7 

32.3 

9.9 

9.0 

2.0 

6.6 

3.9 

1.6 

14.7 

9.6 

16.7 

7.4 

8.2 

19.2 

6.9 

4.3 

3.3 

1.2 

4.1 

18.4 

.2 

6.1 

13.5 

7.4 

.2 

8.3 

.3 

1.3 

14.1 

1.0 

2.4 

2.4 

18.0 

8.7 

24.0 

1.4 

8.2 

5.8 

1.6 

3.5 

11.4 

18.0 

26.7 

3.7 

12.6 

23.1 

5.6 

.4 

a.  Encuentre  el  rango. 

b.  Use  la  aproximacion  del  rango  para  hallar  un  valor 
aproximado  de  s. 

c.  Calcule  .v  para  los  datos  y  comparela  con  su 
aproximacion  del  inciso  b). 

2.58  Una  enfermedad  recurrente,  continua 
Consulte  el  ejercicio  2.57. 

a.  Examine  los  datos  y  cuente  el  numero  de 
observaciones  que  caen  en  los  intervalos  x  ±  s, 
x  ±  2s  y  x  ±  3s. 

b.  7,  Los  porcentajes  que  caen  en  estos  intervalos 
concuerdan  con  el  teorema  de  Chebyshev?  ;  Y  con  la 
Regia  empirica? 

c.  (',Por  que  la  Regia  empirica  podria  no  ser  apropiada 
para  describir  estos  datos? 

2.59  Una  enfermedad  recurrente,  otra  vez 

Encuentre  la  mediana,  asf  como  los  cuartiles  inferior 
y  superior,  para  los  datos  sobre  tiempos  hasta  una 
recurrencia  de  una  enfermedad  del  ejercicio  2.57.  Utilice 
estas  medidas  descriptivas  para  construir  una  grafica  de 
caja  para  los  datos.  Use  la  grafica  de  caja  para  describir  la 
distribucion  de  datos. 

2.60  Atunes,  otra  vez  Consulte  el  ejercicio  2.8. 

A  continuacion  se  reproducen  aqui  los  precios  de 
una  lata  de  6  onzas  o  una  bolsa  de  7.06  onzas,  para 
14  marcas  diferentes  de  atun  claro  empacado  en 
agua,  con  base  en  precios  pagados  nacionalmente  en 
supermercados.4 

.99  1.92  1.23  .85  .65  .53  1.41 

1.12  .63  .67  .69  .60  .60  .66 
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a.  Calcule  el  resumen  de  cinco  numeros. 

b.  Construya  una  grafica  de  caja  para  los  datos. H ay 
algun  resultado  atipico? 

c.  El  valor  x  =  1 .92  se  ve  grande  en  comparacion  con  los 
otros  precios.  Use  un  puntaje  z  para  determinar  si  esta 
es  una  marca  inusualmente  costosa  de  atun. 

2.61  lectrolisis  Un  quimico  analitico  desea  usar 
electrolisis  para  determinar  el  numero  de  moles  de  iones 
de  cobre  en  un  volumen  determinado  de  solucion.  La 
solucion  se  dividio  en  n  =  30  partes  de  .2  mililitros  cada 
una  y  se  probo  cada  una  de  las  partes.  Se  encontro  que  el 
numero  promedio  de  moles  de  iones  de  cobre  para 

las  n  =  30  partes  fue  de  .17  moles;  la  desviacion  estandar 
fue  de  .01  mol. 

a.  Describa  la  distribucion  de  las  mediciones  para  las 
n  =  30  partes  de  la  solucion  usando  el  teorema  de 
Chebyshev. 

b.  Describa  la  distribucion  de  las  mediciones  para  las 

n  =  30  partes  de  la  solucion  usando  la  Regia  empirica. 
(^Espera  usted  que  la  Regia  empirica  sea  apropiada 
para  describir  estos  datos?) 

c.  Suponga  que  el  quimico  habia  empleado  solo  n  =  4 
partes  de  la  solucion  para  el  experimento  y  obtuvo  las 
lecturas  .15,  .19,  .17  y  .15.  (La  Regia  empirica  seria 
apropiada  para  describir  las  n  =  4  mediciones? 

<, Por  que? 

2.62  Cloroformo  De  acuerdo  con  la  EPA,  el 
cloroformo,  que  en  su  estado  gaseoso  es  sospechoso  de 
ser  un  agente  cancerigeno,  esta  presente  en  pequenas 
cantidades  en  todas  las  240  mil  fuentes  ptiblicas  de 
agua  del  pais.  Si  la  media  y  desviacion  estandar  de  las 
cantidades  de  cloroformo  presentes  en  las  fuentes  de 
agua  son  34  y  53  microgramos  por  litro,  respectivamente, 
describa  la  distribucion  para  la  poblacion  de  todas  las 
fuentes  publicas  de  agua. 

2.63  Examenes  de  aptitud  En  contraste  con  examenes 
de  aptitud,  que  son  medidas  predictivas  de  lo  que  se  puede 
lograr  con  capacitacion,  los  examenes  de  conocimientos 
indican  lo  que  una  persona  puede  hacer  en  el  momento 
del  examen.  Se  encontro  que  las  calificaciones  de 

un  examen  de  conocimientos  matematicos  para  400 
estudiantes  tenia  una  media  y  varianza  igual  a  600  y  4900, 
respectivamente.  Si  la  distribucion  de  calificaciones  del 
examen  era  en  forma  de  monticulo,  /.mas  o  menos  cuantas 
de  las  calificaciones  caerfan  en  el  intervalo  de  530  a  670? 

A  p  ro  x  i  m  ad  a  m  cute  cuantas  calificaciones  se  esperaria 
caigan  en  el  intervalo  de  460  a  740? 

2.64  Sueno  y  el  estudiante  universitario  ^Cuanto 
tiempo  duerme  en  una  noche  tipica  en  la  escuela?  A 
un  grupo  de  10  estudiantes  universitarios  se  le  pidio 


informaran  del  numero  de  horas  que  durmio  en  la  noche 
previa,  con  los  siguientes  resultados: 

7,  6,  7.25,  7,  8.5,  5,  8,  7,  6.75,  6 

a.  Encuentre  la  media  y  la  desviacion  estandar  del 
numero  de  horas  de  sueno  para  estos  10  estudiantes. 

b.  Calcule  el  puntaje  z  para  el  maximo  valor  (x  =  8.5). 
(',Es  este  un  estudiante  universitario  que  duerme  mas 
de  lo  normal? 

c.  (',Cual  es  la  medicion  de  la  que  se  informa  con  mas 
frecuencia?  ('  Cual  es  el  nombre  de  esta  medida  de 
centra? 

d.  Construya  una  grafica  de  caja  para  los  datos. 

7,  La  grafica  confirma  sus  resultados  del  inciso  b)? 
[sugerencia:  Como  el  puntaje  z  y  la  grafica  de 
caja  son  dos  metodos  no  relacionados  para  detectar 
resultados  atfpicos  y  usan  diferentes  tipos  de 
estadisticas,  no  necesariamente  tienen  que  producir 
(pero  por  lo  comun  producen)  los  mismos  resultados.] 

(^1) datos  2.65  Rendimiento  en  millas  A  continuation 
se  muestran  las  millas  por  galon  (mpg),  para  cada 
uno  de  los  20  autos  de  tamano  medio  seleccionados  de  una 
linea  de  production  durante  el  mes  de  marzo. 


23.1 

21.3 

23.6 

23.7 

20.2 

24.4 

25.3 

27.0 

24.7 

22.7 

26.2 

23.2 

25.9 

24.7 

24.4 

24.2 

24.9 

22.2 

22.9 

24.6 

a.  (\Cuales  son  el  maximo  y  minimo  de  millas  por  galon? 
(iCual  es  la  autonorma  de  recorrido? 

b.  Construya  un  histograma  de  frecuencia  relativa  para 
estos  datos.  (  Como  describirfa  usted  la  forma  de  la 
distribucion? 

c.  Encuentre  la  media  y  la  desviacion  estandar. 

d.  Ordene  los  datos  de  menor  a  mayor.  Encuentre  los 
puntajes  z  para  las  observaciones  maxima  y  minima. 

7,  Los  consideraria  usted  como  resultados  atfpicos? 
^Por  que  si  o  por  que  no? 

e.  i Que  es  una  mediana? 

f.  Encuentre  los  cuartiles  inferior  y  superior. 

2.66  Rendimiento  en  millas,  continua  Consulte  el 
ejercicio  2.65.  Construya  una  grafica  de  caja  para  los 
datos.  ((Hay  algun  resultado  atipico?  ^Esta  conclusion 
concuerda  con  sus  resultados  del  ejercicio  2.65? 

2.67  Agua  de  mar  contaminada  La  contamination 
causada  por  petroleo  en  mares  y  oceanos  estimula  el 
crecimiento  de  algunos  tipos  de  bacterias.  Una  cantidad 
de  microorganismos  que  se  originan  en  el  petroleo 
(bacterias  por  100  mililitros)  en  10  partes  de  agua  de  mar 
dieron  estas  lecturas; 

49,  70,  54,  67,  59,  40,  61,  69,  71,  52 
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a.  Calcule  el  valor  de  .v  usando  la  aproximacion  de  rango. 

b.  Calcule  iysy  compare  con  la  aproximacion  de  rango 
de  el  inciso  a). 

c.  Construya  una  grafica  de  caja  para  los  datos  y  usela 
para  describir  la  distribucion  de  datos. 

2.68  laloncesto  Se  registraron  los  espectadores  a 
juegos  de  baloncesto  de  una  secundaria  y  se  encontro 
que  tienen  una  media  muestral  y  varianza  de  420  y  25, 
respectivamente.  Calcule  x  ±  s,  x  ±  2s  y  x  ±  3  s  y  luego 
exprese  las  fracciones  aproximadas  de  mediciones  que 
usted  esperarfa  caen  en  estos  intervalos,  de  acuerdo  con 
la  Regia  empfrica. 

2.69  Examenes  de  aptitud  escolar  Los  examenes 
verbales  y  de  aptitud  escolar  de  matematicas  de  un 
Consejo  Universitario  se  califican  en  una  escala  de  200 
a  800.  Aun  cuando  los  examenes  estuvieron  disenados 
originalmente  para  producir  calificaciones  medias  de 
alrededor  de  500,  las  calificaciones  medias  verbales 

y  de  matematicas  en  anos  recientes  han  sido  de  solo 
463  y  493,  respectivamente,  y  tienen  tendencia  hacia 
abajo.  Parece  razonable  suponer  que  una  distribucion 
de  todas  las  calificaciones  de  examen,  ya  sea  verbal 
o  de  matematicas,  tiene  forma  de  montfculo.  Si  cr  es  la 
desviacion  estandar  de  una  de  estas  distribuciones,  ^cual 
es  el  valor  maximo  (aproximadamente)  que  pudiera 
tomar  cr?  Explique. 

2.70  Campismo  en  verano  Un  pasatiempo  favorito 
en  verano  para  muchos  estadounidenses  es  el  campismo. 
De  hecho,  esta  actividad  se  ha  hecho  tan  popular  en 

las  playas  de  California  que  las  reservaciones  tienen 
que  hacerse  con  meses  de  anticipation.  A  continuation 
aparecen  datos  de  un  USA  Today  Snapshot.13 


El  Snapshot  (Instantaneas)  tambien  informa  que 
los  hombres  van  de  excursion  2.9  veces  al  ano,  las 
mujeres  1.7  veces  al  ano  y  que  es  mas  probable  que 
los  hombres  quieran  ir  de  excursion  mas  que  las  mujeres. 


7,  Que  quiere  decir  la  revista  cuando  hablan  de  alrededor 
de  2.9  o  1 .7  veces  al  ano? 

2.71  Rosas  de  tallo  largo  Una  variedad  de  rosas  de 
tallo  largo  tiene  una  distribucion  normal  aproximada,  con 
una  longitud  media  de  tallo  de  15  pulgadas  y  desviacion 
estandar  de  2.5  pulgadas. 

a.  Si  uno  acepta  como  “rosas  de  tallo  largo”  solo  las 
rosas  con  una  longitud  de  tallo  mayor  a  12.5  pulgadas, 
7,  que  porcentaje  de  esas  rosas  serfa  inaceptable? 

b.  7,  Que  porcentaje  de  esas  rosas  tendrfa  una  longitud  de 
tallo  entre  12.5  y  20  pulgadas? 

(^)datos  2.72  Medicina  para  hipertensior  Una 

EX0272  compama  farmaceutica  desea  saber  si  un 
medicamento  experimental  que  se  esta  probando  en 
laboratorios  tiene  algun  efecto  en  la  presion  sangufnea 
sistolica.  A  15  personas  seleccionadas  al  azar  se  les  dio 
el  medicamento  y  se  registraron  sus  presiones  sanguineas 
sistolicas  (en  milfmetros). 


172 

148 

123 

140 

108 

152 

123 

129 

133 

130 

137 

128 

115 

161 

142 

a.  Calcule  el  valor  de  s  usando  la  aproximacion  de  rango. 

b.  Calcule  xy  s  para  las  15  presiones  sanguineas. 

c.  Encuentre  dos  valores,  ay  b,  tales  que  al  menos  75% 
de  las  mediciones  caen  entre  ay  b. 

2.73  Derechos  madereros  A  una  companfa  interesada 
en  derechos  madereros,  para  cierto  terreno  de  pinos 
ayucahuites,  se  le  indica  que  el  diametro  medio  de  estos 
arboles  es  de  14  pulgadas  con  una  desviacion  estandar  de 
2.8  pulgadas.  Suponga  que  la  distribucion  de  diametros 
tiene  forma  aproximada  de  montfculo. 

a.  7,  Que  fraccion  de  los  arboles  tendra  diametros  entre 
8.4  y  22.4  pulgadas? 

b.  7,  Que  fraccion  de  los  arboles  tendra  diametros  mayores 
a  16.8  pulgadas? 

datos  2.74  Ambivalencia  social  Los  siguientes 
datos  representan  las  puntuaciones  de 
ambivalencia  social  para  15  personas,  medidas  por  un 
examen  psicologico.  (Cuanta  mas  alta  la  calificacion,  mas 
fuerte  es  la  ambivalencia.) 

9  13  12 

14  15  11 

10  4  10 

8  19  13 

11  17  9 

a.  Calcule  el  valor  de  s  usando  la  aproximacion  de  rango. 

b.  Calcule  xy  s  para  las  15  calificaciones  de 
ambivalencia  social. 
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c.  7,  Que  fraccion  de  las  calificaciones  en  realidad  estan 
en  el  intervalo  x  ±  2 si 

2.75  Comerciales  en  TV  La  duracion  media  de 
anuncios  comerciales  en  television  en  una  red  televisiva 
determinada  es  de  75  segundos,  con  una  desviacion  es¬ 
tandar  de  20  segundos.  Suponga  que  las  duraciones 
estan  distribuidas  normalmente  en  forma  aproximada. 

a.  ('Cual  es  la  probabilidad  aproximada  de  que  un 
comercial  dure  menos  de  35  segundos? 

b.  ('Cual  es  la  probabilidad  aproximada  de  que  un 
comercial  dure  mas  de  55  segundos? 

2.76  Parasitos  en  zorros  Una  muestra  aleatoria  de 
100  zorros  fue  examinada  por  un  equipo  de  veterinarios 
para  determinar  la  prevalencia  de  un  tipo  particular 

de  parasito.  Contando  el  nil  mem  de  parasitos  por  zorro, 
los  veterinarios  encontraron  que  69  zorros  no  tenian 
parasitos,  17  tenian  un  parasito,  y  asi  sucesivamente. 

A  continuacion  tenemos  una  tabulation  de  frecuencia  de 
los  datos: 


Numero  de  parasitos,  x 

012345  678 

Numero  de  zorros,  f 

69  17  6  3  1  2  1  01 

a.  Construya  un  histograma  de  frecuencia  relativa  para  x, 
el  mi  mem  de  parasitos  por  zorro. 

b.  Calcule  xy  s  para  la  muestra. 

c.  i,Que  fraccion  de  las  cuentas  de  parasitos  cae 
dentro  de  dos  desviaciones  estandar  de  la  media? 
^Dentro  de  tres  desviaciones  estandar?  ^Estos 
resultados  concuerdan  con  el  teorema  de  Chebyshev? 
('/Y  con  la  Regia  empirica? 

2.77  Profesores  universitarios  Considere  una 
poblacion  formada  por  el  numero  de  profesores  por 
colegio  en  pequenos  colegios  de  dos  anos.  Suponga  que 
el  numero  de  profesores  por  colegio  tiene  un  promedio 
/x  =  175  y  una  desviacion  estandar  cr  =  15. 

a.  Use  el  teorema  de  Chebyshev  para  hacer  un  enunciado 
acerca  del  porcentaje  de  colegios  que  tienen  entre  145 
y  205  profesores. 

b.  Suponga  que  la  poblacion  esta  normalmente 
distribuida.  7,  Que  fraccion  de  colegios  tiene  mas  de 
190  profesores? 

datos  2.78  ^Es  precisa?  De  los  datos  siguientes, 
un  estudiante  calculo  que  s  es  .263.  (',En  que 
situation  podriamos  dudar  de  su  precision?  7,Cual  es  el 
valor  correcto  (al  centesimo  mas  cercano)? 

17.2  17.1  17.0  17.1  16.9  17.0  17.1  17.0  17.3  17.2 

17.1  17.0  17.1  16.9  17.0  17.1  17.3  17.2  17.4  17.1 

datos  2.79  Reyes  de  cuadrangulares  En  el  verano 
de  2001,  Barry  Bonds  empezo  su  busqueda  del 


record  de  Mark  McGwire  de  70  cuadrangulares  conectados 
en  una  sola  temporada.  Al  terminar  la  temporada  de  beisbol 
de  2003  de  las  ligas  mayores,  se  registro  el  numero  de 
cuadrangulares  conectados  por  temporada  por  cada  uno 
de  cuatro  superestrellas  de  ligas  mayores  en  su  carrera  y  a 
continuacion  se  presentan  en  las  graficas  de  caja:14 


Escriba  un  parrafo  corto  que  compare  los  modelos  de 
bateo  de  cuadrangulares  de  estos  cuatro  jugadores. 

7^ datos  2.80  3arry  Bonds  En  las  temporadas  que 

siguieron  a  la  de  2001  en  la  que  implanto  record, 
Barry  Bonds  conecto  46,  45,  45,  5  y  26  cuadrangulares, 
respectivamente  (www.espn.com).14  A  continuacion 
aparecen  dos  graficas  de  caja,  una  de  los  cuadrangulares 
de  Bond  en  2001  y  una  segunda  que  inclufa  los  anos 
2002-2006. 


Las  estadisticas  empleadas  para  construir  estas  graficas 
de  caja  se  dan  en  la  tabla. 

Anos  Min  Q,  Mediana  03  IQR  Max  n 

2001  16  25.00  34.00  41.50  16.5  73  16 

2006  5  25.00  34.00  45.00  20.0  73  21 

a.  Calcule  los  limites  superiores  para  estas  dos  graficas 
de  caja. 

b.  (:,Puede  usted  explicar  por  que  el  numero  record  de 
cuadrangulares  es  un  resultado  atipico  en  la  grafica 

de  caja  de  2001,  pero  no  en  la  grafica  de  caja  de  2006? 
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2.81  Edades  de  monedas  de  un  centavo 

A  continuation  aparecen  edades  de  50  monedas  de  un 
centavo  del  ejercicio  1.45  y  el  conjunto  de  datos  EX0145. 
Los  datos  se  han  ordenado  de  menor  a  mayor. 

0000000000 
0  0  11  111  122 

2333445555 
6  8  9  9  10  16  17  17  19  19 

19  20  20  21  22  23  25  25  28  36 

a.  7,Cual  es  la  edad  promedio  de  los  centavos? 

b.  7,Cual  es  la  edad  mediana  de  los  centavos? 

c.  Con  base  en  los  resultados  de  los  incisos  a)  y  b), 
7,como  describirfa  usted  la  distribution  de  edades  de 
estas  50  monedas  de  un  centavo? 

d.  Construya  una  grafica  de  caja  para  el  conjunto  de 
datos.  7,Hay  algun  resultado  atfpico?  7,  La  grafica 
de  caja  confirma  su  description  de  la  forma  de  la 
distribution? 

2.82  Instantaneas  A  continuation  aparecen  unos 
cuantos  datos  publicados  como  Snapshots  (Instantaneas) 
en  USA  Today. 

a.  La  mediana  del  pago  por  hora  para  vendedores  en  la 
industria  de  materiales  de  construction  es  $10.41. 15 

b.  69%  de  trabajadores  estadounidenses  de  16  anos  o 
mayores  trabajan  al  menos  40  horas  por  semana.16 

c.  75%  de  todos  los  profesores  auxiliares  en  Estados 
Unidos  ganan  $91,823  o  menos.17 

d.  Identifique  la  variable  x  que  se  mide,  y  cualesquier 
percentiles  que  pueda  usted  determinar  de  esta 
information. 

(^)  datos  2.83  Patrones  de  respiration  Psicologos 

investigadores  estan  interesados  en  averiguar  si 
los  patrones  de  respiration  de  una  persona  son  afectados 
por  un  tratamiento  experimental  particular.  Para 
determinar  los  patrones  respiratorios  generales  de  las 
n  =  30  personas  en  el  estudio,  los  investigadores 
recolectaron  algunas  mediciones  de  lfnea  de  base,  es  decir, 
el  total  de  ventilation  en  litros  de  aire  por  minuto  ajustados 
al  tamano  del  cuerpo,  para  cada  persona  antes  del 
tratamiento.  Los  datos  se  muestran  a  continuation,  junto 
con  algunas  herramientas  descriptivas  generadas 


por  MINITAB. 

5.23  4.79 

5.83 

5.37 

4.35  5.54 

6.04 

5.48 

6.58  4.82 

5.92  5.38 

6.34 

5.12 

5.14  4.72 

5.17 

4.99 

4.51  5.70 

4.67  5.77 

5.84 

6.19 

5.58  5.72 

5.16 

5.32 

4.96  5.63 

Estadisticas  descriptivas:  litros 

Variable 

N 

N* 

Mean 

SE 

Mean 

StDev 

Liters 

30 

0 

5.3953 

o . 

.  0997 

0.5462 

Minimum 

Q1 

Median  Q3 

Variable 

Maximum 

4 .3500  4 

.  9825 

5.: 

3750  5.7850 

Liters 

6 . 5800 

Grafica  de  tallo  y  hoja:  litros 

Stem-and-leaf  of  Liters  N  =  30 
Leaf  Unit  =  0.10 
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2333 

14 

5 
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5 
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3 

1 

6 
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a.  Haga  un  resumen  de  las  caracterfsticas  de  la 
distribution  de  datos  usando  la  salida  MINITAB. 

b.  7  La  Regia  empfrica  da  una  buena  description  de  la 
proportion  de  mediciones  que  caen  dentro  de  dos  o 
tres  desviaciones  estandar  de  la  media?  Explique. 

c.  i Que  tan  grande  o  pequena  tiene  que  ser  una  medicion 
de  ventilation  antes  que  sea  considerada  como  poco 
comun? 

(^)datos  2.84  Ordenamiento  de  objetos  Los  datos 

siguientes  son  tiempos  de  respuesta  en  segundos 
para  n  =  25  estudiantes  de  primer  ano  para  ordenar  tres 
objetos  por  tamano. 


5.2 

3.8 

5.7 

3.9 

3.7 

4.2 

4.1 

4.3 

4.7 

4.3 

3.1 

2.5 

3.0 

4.4 

4.8 

3.6 

3.9 

4.8 

5.3 

4.2 

1"-; 

3.3 

4.2 

3.8 

5.4 

a.  Encuentre  la  media  y  la  desviacion  estandar  para  estos 
25  tiempos  de  respuesta. 

b.  Ordene  los  datos  de  menor  a  mayor. 

c.  Encuentre  los  puntajes  z  para  los  tiempos  de  respuesta 
mlnimo  y  maximo.  /.Hay  alguna  razon  para  creer 
que  estos  tiempos  son  extraordinariamente  grandes  o 
pequenos?  Explique. 

2.85  Ordenamiento  de  objetos,  continua  Consulte 

el  ejercicio  2.84. 

a.  Encuentre  el  resumen  de  cinco  numeros  para  este 
conjunto  de  datos. 

b.  Construya  una  grafica  de  caja  para  los  datos. 

c.  (',Hay  algunos  tiempos  de  respuesta  extraordinaria¬ 
mente  grandes  o  pequenos  identificados  por  la  grafica 
de  caja? 

d.  Construya  una  grafica  de  tallo  y  hoja  para  los  tiempos 
de  respuesta.  /Como  describirfa  usted  la  forma  de  la 
distribution?  /,La  forma  de  la  grafica  de  caja  confirma 
este  resultado? 
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m  APPLET  'cicios 

2.86  Consulte  el  Conjunto  de  Datos  #  1  en  el  applet 
How  Extreme  Values  Affect  the  Mean  and  Median. 
(Como  afectan  los  valores  extremos  a  la  media  y  a  la 
mediana).  Este  applet  se  carga  con  una  grafica  de  puntos 
para  las  siguientes  n  =  5  observaciones:  2,  5,  6,  9,  11. 

a.  /C  miles  son  la  media  y  la  mediana  para  este  conjunto 
de  datos? 

b.  Use  su  mouse  para  cambiar  el  valor  x  =  1 1  (el  punto 
verde  movible)  ax  =  13.  ^Cuales  son  la  media  y 
mediana  para  el  nuevo  conjunto  de  datos? 

c.  Use  su  mouse  para  mover  el  punto  verde  ax  =  33. 
Cuando  el  valor  maximo  es  sumamente  grande  en 
comparacion  con  las  otras  observaciones,  ('  cual  es 
mayor,  la  media  o  la  mediana? 

d.  ^Que  efecto  tiene  un  valor  extremadamente  grande 
sobre  la  media?  ^Que  efecto  tiene  sobre  la  mediana? 

2.87  Consulte  el  Conjunto  de  Datos  #2  en  el  applet 
How  Extreme  Values  Affect  the  Mean  and  Median. 

Este  applet  se  carga  con  una  grafica  de  puntos  para  las 
siguientes  n  =  5  observaciones:  2,  5,  10,  11,  12. 

a.  Use  su  mouse  para  mover  el  valor  x  =  12  a  la 
izquierda  hasta  que  sea  menor  que  el  valor  x  =  1 1 . 

b.  A  medida  que  el  valor  de  x  se  hace  mas  pequeno, C|ue 
pasa  a  la  media  muestral? 

c.  A  medida  que  el  valor  de  x  se  hace  mas  pequeno,  ('en 
que  punto  cambia  finalmente  el  valor  de  la  mediana? 

d.  Cuando  usted  mueva  el  punto  verde,  ^cuales  son  los 
posibles  valores  maximo  y  mmimo  para  la  mediana? 

2.88  Consulte  el  Conjunto  de  Datos  #3  en  el  applet 
How  Extreme  Values  Affect  the  Mean  and  Median. 

Este  applet  se  carga  con  una  grafica  de  puntos  para  las 
siguientes  n  =  5  observaciones:  27,  28,  32,  34,37. 

a.  ('Cuales  son  la  media  y  la  mediana  para  este  conjunto 
de  datos? 

h.  Use  su  mouse  para  cambiar  el  valor  x  =  27  (el  punto 
verde  movible)  ax  =  25.  <',C miles  son  la  media  y 
mediana  para  el  nuevo  conjunto  de  datos? 

c.  Use  su  mouse  para  mover  el  punto  verde  ax  =  5. 
Cuando  el  valor  mmimo  es  sumamente  pequeno  en 
comparacion  con  las  otras  observaciones,  ^cual  es 
mayor,  la  media  o  la  mediana? 

d.  i  En  que  valor  de  x  la  media  es  igual  a  la  mediana? 

e.  /  C u ales  son  los  posibles  valores  mmimo  y  maximo 
para  la  mediana? 

f.  ^Que  efecto  tiene  un  valor  extremadamente  pequeno 
sobre  la  media?  ^Que  efecto  tiene  sobre  la  mediana? 

2.89  Consulte  el  apple  Why  Divide  by  n  —  1  (Por 
que  dividir  entre  n  —  1).  El  primer  applet  de  la  pagina 


selecciona  al  azar  una  muestra  de  n  =  3  de  una  poblacion 
en  la  que  la  desviacion  estandar  es  cr  =  29.2. 

a.  De  un  clic  en  Aparecera  una  muestra 

formada  de  n  =  3  observaciones.  Use  su  calculadora 
para  verificar  los  valores  de  la  desviacion  estandar 
cuando  divida  entre  n  —  1  y  n  se  muestra  en  el  applet. 

b.  De  un  clic  en  otra  vez.  Calcule  el  promedio 

de  las  dos  desviaciones  estandar  (dividiendo  entre 

n  —  1)  de  los  incisos  a)  y  b).  Repita  el  proceso  para 
las  dos  desviaciones  estandar  (dividiendo  entre  n). 
Compare  sus  resultados  con  los  que  se  muestran  en 
rojo  en  el  applet. 

c.  Usted  puede  ver  como  los  dos  estimadores  del 

inciso  a)  se  comportan  “a  la  larga”  si  da  un  clic  en 
UittlulM  o  en  varias  veces,  hasta  que  el 

promedio  de  todas  las  desviaciones  estandar  empiece 
a  estabilizarse.  /  Cual  de  los  dos  metodos  da  una 
desviacion  estandar  mas  cercana  a  cr  =  29.2? 

d.  A  la  larga,  i a  que  distancia  esta  la  desviacion  estandar 
cuando  divide  entre  n? 

2.90  Consulte  el  applet  Why  Divide  by  n  —  1.  El 
segundo  applet  de  la  pagina  al  azar  selecciona  una 
muestra  de  n  =  10  de  la  misma  poblacion  en  la  que  la 
desviacion  estandar  es  cr  =  29.2. 

a.  Repita  las  instrucciones  de  los  incisos  c)  y  d)  del 
ejercicio  2.89. 

b.  Con  base  en  su  simulation,  cuando  el  tamano  muestral 
es  mas  grande,  /;hay  diferencia  si  usted  divide  entre  n  o 
n  —  1  cuando  calcule  la  desviacion  estandar  muestral? 

2.91  Si  todavfa  no  lo  hace,  use  el  primer  applet  Building 
a  Box  Plot  (Construyendo  una  grafica  de  puntos)  para 
construir  una  grafica  de  caja  para  los  datos  del  ejemplo 
2.14. 

a.  Compare  la  grafica  de  caja  terminada  contra  la  grafica 
que  se  muestra  en  la  figura  2.18. 

b.  ^Como  describirfa  usted  la  forma  de  la  distribucion  de 
datos? 

c.  c,Hay  algunos  resultados  atfpicos?  Si  es  asf,  (:cual  es  el 
valor  de  la  observation  poco  comun? 

2.92  Use  el  segundo  applet  Building  a  Box  Plot 
(Construyendo  una  grafica  de  puntos)  para  construir 
una  grafica  de  caja  para  los  datos  del  ejemplo  2.13. 

a.  ^Como  describirfa  usted  la  forma  de  la  distribucion  de 
datos? 

b.  Use  la  grafica  de  caja  para  aproximar  los  valores  de 
la  mediana,  el  cuartil  inferior  y  el  cuartil  superior. 
Compare  sus  resultados  contra  los  valores  reales 
calculados  en  el  ejemplo  2.13. 
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CASO 

prActico 


Los  muchachos  del  verano 


(,Cual  liga  de  beisbol  ha  tenido  los  mejores  bateadores?  Muchos  de  nosotros  hemos 
oido  de  grandes  del  beisbol  como  Stan  Musial,  Hank  Aaron,  Roberto  Clemente  y  Pete 
Rose  de  la  Liga  Nacional  y  de  Ty  Cobb,  Babe  Ruth,  Ted  Williams,  Rod  Carew  y  Wade 
Boggs  de  la  Liga  Americana.  Pero,  (',ha  oido  alguna  vez  de  Willie  Keeler,  quien  bateo  .432 
para  los  Orioles  de  Baltimore  o  de  Nap  Lajoie,  quien  bated  .422  para  los  A’s  de  Filadel- 
fia?  Los  promedios  de  bateo  para  los  campeones  de  las  Ligas  Nacional  y  Americana  se 
dan  en  el  sitio  web  del  Student  Companion.  Los  promedios  de  bateo  para  la  Liga  Nacional 
empezaron  en  1876  con  Roscoe  Barnes,  cuyo  promedio  de  bateo  fue  de  .403  cuando  jugo 
con  los  Cachorros  de  Chicago. 

La  ultima  entrada  para  la  Liga  Nacional  es  para  el  ano  2006,  cuando  Freddy  Sanchez  de 
los  Piratas  de  Pittsburgh  promedio  .344.  Los  records  de  la  Liga  Americana  empezaron  en 
1901  con  Nap  Lajoie  de  los  A’s  de  Filadelfia,  quien  bated  .422  y  terminan  en  2006  con  Joe 
Mauer  de  los  Mellizos  de  Minnesota,  quien  bated  .347. 18  ^Como  podemos  resumir  la 
informacion  de  este  conjunto  de  datos? 


1.  Use  el  MINITAB  u  otro  paquete  de  software  de  estadistica  para  describir  los  promedios 
de  bateo  para  los  campeones  bateadores  de  la  Liga  Americana  y  la  Nacional.  Genere 
cualesquiera  graficas  que  puedan  ayudarle  a  interpretar  estos  conjuntos  de  datos. 

2.  (.Una  liga  parece  tener  un  porcentaje  mas  alto  de  hits  que  la  otra?  ^Los  promedios  de 
bateo  de  una  liga  parecen  ser  mas  variables  que  la  otra? 

3.  <',Hay  algunos  resultados  atipicos  en  cualquiera  de  las  dos  ligas? 

4.  Resuma  su  comparacion  de  las  dos  ligas  de  beisbol. 
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OBJETIVOS  GENERALES 


Descripcion 
de  datos 
bivariados 


A  veces  los  datos  que  son  recolectados  estan  formados 
por  observaciones  para  dos  variables  en  la  misma  uni- 
dad  experimental.  Tecnicas  especiales  que  se  pueden 
emplear  al  describir  estas  variables  ayudaran  al  usuario  a 
identificar  posibles  relaciones  entre  ellas. 


INDICE  DEL  CAPITULO 


©  Markstahl/Dreamstime 


W)  tPiensa  usted  que  sus 
platos  estan  realmente 
limpios? 


La  recta  de  mejor  ajuste  (3.4) 

Datos  bivariados  (3.1 ) 

Covarianza  y  el  coeficiente  de  correlacion  (3.4) 
Graficas  de  dispersion  para  dos  variables 
cuantitativas  (3.3) 

Graficas  de  pastel  lado  a  lado,  graficas  de  lineas 
comparativas  (3.2) 


El  precio  de  un  aparato  electrodomestico,  por 
ejemplo  una  lavadora  de  loza,  yjndica  algo  acer- 
ca  de  su  calidad?  En  el  estudio  practico  del  final 
de  este  capitulo,  clasificamos  20  marcas  diferen- 
tes  de  lavadoras  de  loza  de  acuerdo  a  sus  precios 
y  luego  las  calificamos  en  varias  caracterfsticas, 
por  ejemplo  en  como  funciona  la  lavadora,  cuanto 


Graficas  de  barra  lado  a  lado,  graficas  de  barras 
apiladas  (3.2) 


ENTRENADOR  PERSONAL 


£Como  calculo  el  coeficiente  de  correlacion? 
£C6mo  calculo  la  recta  de  regresion? 


ruido  hace,  su  costo  ya  sea  de  gas  o  de  electrici- 
dad,  su  tiempo  de  ciclo  y  su  consumo  de  agua. 
Las  tecnicas  presentadas  en  este  capitulo  ayuda¬ 
ran  a  contestar  nuestra  pregunta. 
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"Bi"  quiere  decir  "dos".  Los 
datos  bivariados  generan 
pares  de  mediciones. 


DATOS  BIVARIADOS 

Es  muy  frecuente  que  investigadores  se  interesen  en  mas  de  solo  una  variable  que  se 
pueda  medir  durante  su  investigacion.  Por  ejemplo,  una  companfa  aseguradora  de  autos 
podrfa  estar  interesada  en  el  numero  de  vehfculos  propiedad  de  un  tenedor  de  polizas, 
asf  como  en  el  numero  de  quienes  conducen  un  vehiculo  en  la  familia.  Un  economista 
podrfa  necesitar  medir  la  cantidad  gastada  por  semana  en  comestibles  en  una  familia, 
y  tambien  el  numero  de  personas  de  esa  familia.  Un  agente  de  ventas  de  bienes  rafces 
podrfa  medir  el  precio  de  venta  de  una  propiedad  residencial  y  la  superficie  en  pies  cua- 
drados  de  la  sala. 

Cuando  dos  variables  se  miden  en  una  sola  unidad  experimental,  los  datos  resultantes 
se  denominan  datos  bivariados.  ^Como  se  deben  presentar  estos  datos?  No  solo  son 
importantes  ambas  variables  cuando  se  estudian  por  separado,  sino  que  el  experimen- 
tador  tambien  puede  explorar  la  relation  entre  las  dos  variables.  Los  metodos  para 
graficar  datos  bivariados,  ya  sean  cualitativos  o  cuantitativos,  permiten  estudiar  las  dos 
variables  juntas.  A1  igual  que  con  datos  univariados,  se  usan  diferentes  graficas  segun  el 
tipo  de  variables  que  se  midan. 


GRAFICAS  PARA  VARIABLES 
CUALITATIVAS 

Cuando  al  menos  una  de  las  dos  variables  es  cualitativa,  se  pueden  usar  graficas  de  pas¬ 
tel,  ya  sean  sencillas  o  mas  elaboradas,  graficas  de  lfneas  y  graficas  de  barras  para  pre¬ 
sentar  y  describir  los  datos.  A  veces  habra  una  variable  cualitativa  y  una  cuantitativa  que 
se  han  medido  en  dos  diferentes  poblaciones  o  grupos.  En  este  caso,  se  pueden  usar  dos 
graficas  de  pastel  lado  a  lado  o  una  grafica  de  barras  en  la  que  las  barras  para  las  dos  po¬ 
blaciones  se  colocan  una  al  lado  de  la  otra.  Otra  opcion  es  usar  una  grafica  de  barras 
apiladas,  en  la  que  las  barras  para  cada  categorfa  se  ponen  una  sobre  la  otra. 

A  los  profesores  de  universidades  privadas  se  les  paga  mas  que  a  los  de  universidades 
publicas?  Los  datos  de  la  tabla  3.1  fueron  recolectados  de  una  muestra  de  400  profeso¬ 
res  universitarios  cuyo  rango,  tipo  de  universidad  y  salario  se  registraron.1  El  numero 
en  cada  celda  es  el  salario  promedio  (en  miles  de  dolares)  para  todos  los  profesores  que 
cayeron  en  esa  categorfa.  Use  una  grafica  para  contestar  la  pregunta  planteada  para  esta 
muestra. 


TABLA  3.1  Salarios  de  profesores  por  rango  y  tipo  de  universidad 

Detiempo  Profesor  Profesor 
complete  adjunto  auxiliar 

Publica  94.8  B5.9  56.4 

Privada  118.1  76.0  65.1 


Fuente:  Digest  of  Educational  Statistics 


Solucion  Para  presentar  los  salarios  promedio  de  estos  400  profesores,  usted  puede 
usar  una  grafica  de  barras  lado  a  lado,  como  se  muestra  en  la  figura  3.1.  La  altura  de 
las  barras  es  el  salario  promedio,  donde  cada  par  de  barras  a  lo  largo  del  eje  horizontal 
representa  un  rango  profesional  diferente.  Los  salarios  son  considerablemente  mas  altos 
para  profesores  de  tiempo  completo  en  universidades  privadas,  pero  hay  menos  diferen- 
cias  sorprendentes  en  los  dos  rangos  inferiores. 
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FIGURA  3.1 

Graficas  de  barras 
comparativas  para  el 
ejemplo  3.1 


Escuela  Publica  Privada  Publica  Privada  Publica  Privada 
rango  Tiempo  completo  Adjunto  Auxiliar 


Junto  con  los  salarios  para  los  400  profesores  universitarios  del  ejemplo  3.1,  el  investi- 
gador  registro  dos  variables  cualitativas  para  cada  profesor:  rango  y  tipo  de  universidad. 
La  tabla  3.2  muestra  el  numero  de  profesores  en  cada  una  de  las  2  X  3  =  6  categories. 
Use  graficas  comparativas  para  describir  los  datos.  ^Las  universidades  privadas  emplean 
tantos  profesores  de  alto  rango  como  las  publicas? 


TABLA  3.2  Numero  de  profesores  por  rango  y  tipo  de  universidad 

De  tiempo  Profesor  Profesor 

completo  adjunto  auxiliar  Total 

Publica  24  57  69  150 

Privada  60  78  112  250 


Solucion  Los  numeros  de  la  tabla  no  son  mediciones  cuantitativas  en  una  sola  uni- 
dad  experimental  (el  profesor).  Son  frecuencias,  o  cantidades,  del  numero  de  profesores 
que  caen  en  cada  categorfa.  Para  comparar  los  numeros  de  profesores  en  universida¬ 
des  publicas  y  privadas,  es  necesario  trazar  graficas  de  pastel  y  mostrarlas  una  junto  a  la 
otra,  como  en  la  figura  3.2. 


FIGURA  3.2 

Graficas  de  pastel 
comparativas  para  el 
ejemplo  3.2 


Privadas 


Publicas 


Categoria 

|  |  Tiempo  completo 
|  |  Profesor  adjunto 
|  |  Profesor  auxiliar 
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FIGURA  3.3 

Grafica  de  barras  apiladas 
para  el  ejemplo  3.2 


TABLA  3.3 


De  manera  optional,  se  puede  trazar  ya  sea  una  grafica  de  barras  apiladas  o  lado  a  lado. 
La  grafica  de  barras  apiladas  se  muestra  en  la  figura  3.3. 


Aun  cuando  las  graficas  no  son  muy  diferentes,  se  puede  ver  que  las  universidades 
publicas  tienen  menos  profesores  de  tiempo  completo  y  mas  profesores  adjuntos  que  las 
privadas.  La  razon  para  estas  diferencias  no  es  tiara,  pero  se  puede  especular  que  las  uni¬ 
versidades  privadas,  con  sus  salarios  mas  altos,  pueden  atraer  mas  profesores  de  tiempo 
completo.  O  quiza  las  universidades  publicas  no  esten  dispuestas  a  promover  profesores 
a  las  filas  de  paga  mas  alta.  En  cualquier  caso,  las  graficas  dan  un  medio  para  comparar 
los  dos  conjuntos  de  datos. 

Usted  tambien  puede  comparar  las  distribuciones  para  universidades  publicas  contra 
las  privadas  al  crear  distribuciones  condicionales  de  datos.  Estas  distribuciones  condi- 
cionales  se  muestran  en  la  tabla  3.3.  Una  distribution  muestra  la  proportion  de  profeso¬ 
res  en  cada  uno  de  los  tres  rangos  bajo  la  condicion  de  que  la  universidad  es  publica,  y  la 
otra  muestra  las  proporciones  bajo  la  condicion  de  que  la  universidad  es  privada.  Estas 
frecuencias  relativas  son  mas  faciles  de  comparar  que  las  frecuencias  reales  y  llevan  a 
las  mismas  conclusiones: 

•  La  proportion  de  profesores  auxiliares  es  casi  la  misma  para  universidades  publi¬ 
cas  y  privadas. 

•  Las  universidades  publicas  tienen  una  menor  proportion  de  profesores  de  tiempo 
completo  y  una  mayor  de  profesores  adjuntos. 


Proporciones  de  profesores  por  rango  para  universidades  publicas 
y  privadas 


De  tiempo 

completo  Adjunto  Auxiliar  Total 


Publica 

24  _ 

.16 

57 

.38 

69 

=  .46 

1.00 

Privada 

150 

BO  _ 

.24 

150 

78  _ 

.31 

150 

112 

=  .45 

1.00 

250 

250 

250 
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© 


EJERCICIOS 


TECNICAS  BASICAS 

3.1  Diferencias  de  genero  Los  hombres  y  mujeres 
que  contestaron  un  cuestionario  acerca  de  las  diferencias 
de  genero  estan  clasificados  en  tres  grupos,  segun  sus 
respuestas  a  la  primera  pregunta: 

Grupo  1  Grupo2  Grupo3 

Hombres  37  49  72 

Mujeres  7  50  31 

a.  Genere  graficas  de  pastel  juntas  para  describir  estos  datos. 

b.  Genere  una  grafica  de  barras  lado  a  lado  para  describir 
estos  datos. 

c.  Trace  una  grafica  de  barras  apiladas  para  describir 
estos  datos. 

d.  ('  Cual  de  las  tres  graficas  describe  mejor  la  diferencia 
o  similitud  de  las  respuestas  de  hombres  y  mujeres? 

3.2  Estado  por  estado  Un  grupo  de  artfculos  esta 
clasificado  de  acuerdo  con  cierto  atributo  — X,  Y,  Z — 
y  de  acuerdo  al  estado  en  el  que  se  producen: 

X  Y  Z 

Nueva  York  20  5  5 

California  10  10  5 

a.  Genere  una  grafica  de  barras  comparativa  (una  al  lado 
de  la  otra)  para  comparar  los  numeros  de  artfculos  de 
cada  tipo  hechos  en  California  y  Nueva  York. 

b.  Genere  una  grafica  de  barras  apiladas  para  comparar 
los  numeros  de  artfculos  de  cada  tipo  hechos  en  los 
dos  estados. 

c.  <',Cual  de  los  dos  tipos  de  presentation  en  los  incisos 
a)  y  b)  se  entiende  con  mas  facilidad?  Explique. 

d.  f,Que  otros  metodos  graficos  podrfan  usarse  para 
describir  los  datos? 

3.3  Gasto  de  consumidores  La  tabla  siguiente  muestra 
las  cantidades  promedio  gastadas  por  semana  por  hombres 
y  mujeres  en  cada  una  de  cuatro  categories  de  gasto: 

A  B  C  D 

Hombres  $54  $27  $105  $22 

Mujeres  21  85  100  75 

a.  vCuales  posibles  metodos  graficos  podrfan  usarse  para 
comparar  los  patrones  de  gasto  de  mujeres  y  hombres? 

b.  Escoja  dos  metodos  diferentes  de  graficar  y  muestre 
los  datos  en  forma  grafica. 

c.  i  Que  se  puede  decir  acerca  de  las  similitudes  o 
diferencias  en  los  patrones  de  gasto  para  hombres  y 
mujeres? 

d.  ^Cual  de  los  dos  metodos  empleados  en  el  inciso  b)  da 
una  mejor  grafica  descriptiva? 


APLICACIONES 

3.4  M'S  Las  distribuciones  de  colores  para  dos 
bolsas  de  dulces  M&M’S®,  una  sencilla  y  otra  de 
cacahuates,  se  muestran  en  la  tabla  siguiente.  Escoja  un 
metodo  grafico  apropiado  y  compare  las  distribuciones. 

Cafe  Amarillo  Rojo  Anaranjado  Verde  Azul 

Sencillo  15  14  12  4  5  6 

Cacahuate  6  2  2  3  3  5 

3.5  zCuanto  tiempo  libre?  Cuando  usted  estaba  en 
crecimiento,  ^sentfa  que  no  tenfa  suficiente  tiempo  libre? 
Padres  e  hijos  tienen  opiniones  diferentes  sobre  este 
tema.  Un  grupo  de  investigation  realizo  una  encuesta 

a  198  padres  y  200  ninos  y  registro  sus  respuestas  a 
la  pregunta  “^Cuanto  tiempo  libre  tiene  su  hijo?”  o 
“(  Cluanto  tiempo  libre  tiene  usted?”  Las  respuestas  se 
muestran  en  la  tabla  siguiente:2 

Solo  el  No  No 

apropiado  suficiente  Demasiado  sabe 

Padres  138  14  40  6 

Hijos  130  48  16  6 

a.  Defina  la  muestra  y  la  poblacion  de  interes  para  los 
investigadores. 

b.  Describa  las  variables  que  hayan  sido  medidas  en  este 
estudio.  ('  Las  variables  son  cualitativas  o  cuantitativas? 
(,Los  datos  son  univariados  o  bivariados? 

c.  i Que  representan  las  entradas  en  las  celdas? 

d.  Use  graficas  de  pastel  comparativas  para  contrastar  las 
respuestas  de  padres  e  hijos. 

e.  Cu ales  otras  tecnicas  graficas  podrfan  usarse  para 
describir  los  datos?  ^Alguna  de  estas  tecnicas  serfa 
mas  informativa  que  las  graficas  de  pastel  construidas 
en  el  inciso  d)? 

@  datos  3.6  Indice  de  precios  al  consumidor  El 

precio  de  la  vivienda  en  Estados  Unidos  ha 
aumentado  considerablemente  en  la  ultima  decada,  como 
lo  demuestran  los  indices  de  precios  al  consumidor  (IPC) 
para  vivienda  y  transporte.  Estos  IPC  aparecen  en  la  tabla 
siguiente  para  los  anos  1996  a  los  primeros  cinco  meses 
de  2007.3 


Ano 

1996 

1997 

1998 

1999 

2000 

2001 

Vivienda 

152.8 

156.8 

160.4 

163.9 

169.6 

176.4 

Transporte 

143.0 

144.3 

141.6 

144.4 

153.3 

154.3 

Ano 

2002 

2003 

2004 

2005 

2006 

2007 

Vivienda 

180.3 

184.8 

189.5 

195.7 

203.2 

207.8 

Transporte 

152.9 

157.6 

163.1 

173.9 

180.9 

181.0 

Fuente:  www.bls.gov 
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a.  Genere  graficas  de  barras  comparativas  de  lado  a  lado 
para  describir  los  IPC  en  el  tiempo. 

b.  Trace  dos  graficas  de  llneas  en  el  mismo  conjunto  de 
ejes  para  describir  los  IPC  en  el  tiempo. 

c.  ^Que  conclusiones  se  pueden  sacar  usando  las  dos 
graficas  de  los  incisos  a)  y  b)?  ^Cual  es  la  mas 
eficiente? 

datos  3.7  ^Que  tan  grande  es  la  familia?  Una 

Camara  de  Comercio  local  entrevisto  a  126 
familias  dentro  de  su  ciudad,  registrando  el  tipo  de 
residencia  y  el  numero  de  miembros  de  la  familia  en  cada 
una  de  estas.  Los  datos  se  muestran  en  la  tabla  siguiente. 

Tipo  de  residencia 

Miembros  en  la  familia  Departamento  Duplex  Casa 

1  8  10  2 

2  15  4  14 

3  9  5  24 

4omas  6  1  28 

a.  Use  una  grafica  de  barras  una  al  lado  de  la  otra  para 
comparar  el  numero  de  miembros  de  una  familia  que 
viven  en  cada  uno  de  los  tres  tipos  de  residencia. 

b.  Use  una  grafica  de  barras  apiladas  para  comparar  el 
numero  de  miembros  de  una  familia  que  viven  en  cada 
uno  de  los  tres  tipos  de  residencias. 


c.  (:,Que  conclusiones  se  pueden  sacar  usando  las  graficas 
de  los  incisos  a)  y  b)? 

(^)datos  3.8  Dontribuciones  de  caridad  Algunas 
organizaciones  caritativas  dependen  del 
apoyo  de  donaciones  privadas  y  de  otras  fuentes.  A 
continuacion  vemos  las  fuentes  de  ingreso  en  un  ano 
reciente  para  varias  organizaciones  bien  conocidas  de 
Estados  Unidos.1 2 3 4 


Cantidades  ($  millones) 


Organization 

Privada 

Otra 

Total 

Ejercito  de  Salvacion 

$1545 

$1559 

$3104 

Asociacion  Cristiana  de  Jovenes 

773 

4059 

4832 

Cruz  Roja  de  Estados  Unidos 

557 

2509 

3066 

Sociedad  Americana  de  Cancer 

868 

58 

926 

Sociedad  Americana  del  Corazon 

436 

157 

593 

Total 

$4179 

$8342 

$12521 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 

a.  Construya  una  grafica  de  barras  apiladas  para 
presentar  las  fuentes  de  ingreso  dadas  en  la  tabla. 

b.  Construya  dos  graficas  comparativas  de  pastel  para 
presentar  las  fuentes  de  ingreso  dadas  en  la  tabla. 

c.  Escriba  un  breve  parrafo  que  sintetice  la  informacion 
que  se  pueda  obtener  al  ver  estas  graficas.  <',Cutil  de  los 
dos  tipos  de  graficas  comparativas  es  mas  efectiva? 


grAficas  de  dispersion  para 

DOS  VARIABLES  CUANTITATIVAS 

Cuando  las  dos  variables  que  hayan  de  presentarse  en  una  grafica  son  cuantitativas,  una 
de  ellas  se  grafica  a  lo  largo  del  eje  horizontal  y  la  otra  a  lo  largo  del  eje  vertical.  Es  fre- 
cuente  que  a  la  primera  variable  se  le  denomine  x  y,  a  la  otra,  y,  de  modo  que  la  grafica 
toma  la  forma  de  una  grafica  en  los  ejes  (x,  y),  que  es  mas  conocida.  Cada  par  de  valores 
de  datos  se  grafica  como  punto  en  esta  grafica  de  dos  dimensiones,  llamada  grafica  de 
dispersion.  Es  la  extension  en  dos  dimensiones  de  la  grafica  de  puntos  que  usamos  para 
graficar  una  variable  cuantitativa  en  la  seccion  1 .4. 

Se  puede  describir  la  relacion  entre  dos  variables,  x  y  y,  usando  los  patrones  que  se 
muestran  en  la  grafica  de  dispersion. 


•  iQue  tipo  de  modelo  se  muestra?  7 H ay  una  tendencia  constante  hacia  arriba 
o  hacia  abajo  que  siga  un  modelo  en  llnea  recta?  7  Hay  un  modelo  curvado? 

7N0  hay  modelo  en  absoluto,  sino  solo  una  dispersion  aleatoria  de  puntos? 

•  iQue  tan  fuerte  es  el  modelo?  <:,Todos  los  puntos  siguen  exactamente  el  mo¬ 
delo,  o  la  relacion  es  solo  debilmente  visible? 

•  ;,Hav  algunas  observaciones  poco  comunes?  Un  resultado  atlpico  es  un  punto 
que  esta  lejos  del  conglomerado  de  los  puntos  restantes.  7  Los  puntos  se  apinan  en 
grupos?  Si  es  asl,  7  hay  una  explication  para  las  agrupaciones  observadas? 
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El  numero  x  de  miembros  de  una  familia,  asf  como  la  cantidad  y  gastada  por  semana  en 
comestibles,  se  miden  para  seis  familias  de  una  localidad.  Trace  una  grafica  de  disper¬ 
sion  de  estos  seis  puntos  de  datos. 


x 

v 


2 

$95.75 


2_ 3_ 4_ 1 

$110.19  $118.33  $150.92  $85.86 


5 

$180.62 


Solucion  Marque  el  eje  horizontal  x  y  el  eje  vertical  y.  Grafique  los  puntos  usando 
las  coordenadas  (x,  y)  por  cada  uno  de  los  seis  pares.  La  grafica  de  dispersion  de  la  figu- 
ra  3.4  muestra  los  seis  pares  marcados  como  puntos.  Se  puede  ver  un  modelo  incluso 
con  solo  seis  pares  de  datos.  El  costo  semanal  de  alimentos  aumenta  con  el  numero  de 
miembros  de  la  familia  en  una  relacion  aparente  de  lrnea  recta. 

Supongamos  que  se  encuentra  que  una  septima  familia  con  dos  miembros  gasto  $165 
en  alimentos.  Esta  observacion  se  muestra  como  una  X  en  la  figura  3.4.  No  se  ajusta  al 
modelo  lineal  de  las  otras  seis  observaciones  y  esta  clasificada  como  resultado  atipico. 
Posiblemente  estas  dos  personas  jtuvieron  una  fiesta  en  la  semana  de  la  encuesta! 


FIGURA  3.4 

Diagrama  de  dispersion 
para  el  ejemplo  3.3 


Un  distribuidor  de  vinos  de  mesa  realizo  un  estudio  de  la  relacion  entre  precio  y  demanda 
usando  un  tipo  de  vino  que  de  ordinario  se  vende  en  $10.00  por  bote  11a.  Vendio  este  vino 
en  10  lugares  diferentes  en  un  periodo  de  12  meses,  usando  cinco  niveles  diferentes  de 
precio,  de  $10  a  $14.  Los  datos  se  dan  en  la  tabla  3.4.  Construya  una  grafica  de  disper¬ 
sion  para  los  datos  y  use  la  grafica  para  describir  la  relacion  entre  precio  y  demanda. 


TABLA  3.4  Cajas  de  vino  vendidas  en  cinco  niveles  de  precio 

Cajas  vendidas 

por  10000  habitantes  Precio  por  botella 


23,21 

$10 

19, 18 

11 

15, 17 

12 

19,  20 

13 

25,  24 

14 
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Solucion  Los  10  puntos  de  datos  se  grafican  en  la  flgura  3.5.  Cuando  el  precio 
aumenta  de  $10  a  $12,  la  demanda  disminuye.  No  obstante,  cuando  el  precio  conti- 
niia  aumentando,  de  $12  a  $14,  la  demanda  empieza  a  aumentar.  Los  datos  muestran 
un  modelo  en  curva,  con  la  relacion  cambiando  cuando  cambia  el  precio.  ^Como  se 
explica  esta  relacion?  Posiblemente,  el  precio  aumentado  es  una  serial  de  mejor  calidad 
para  el  consumidor,  lo  cual  causa  el  aumento  en  demanda  una  vez  que  el  costo  pase  de 
$12.  Se  podria  pensar  en  otras  razones,  o  quiza  alguna  otra  variable,  por  ejemplo  el  in- 
greso  de  personas  de  los  lugares  donde  se  hizo  la  venta,  que  puedan  causar  el  cambio. 


FIGURA  3.5 

Grafica  de  dispersion  para 
el  ejemplo  3.4 


22.5- 


'!  20-0  - 
u 


17.5- 


15.0  - 


10  11  12  13  14 

Precio 


m 


FIGURA  3.6 


Applet  llamado  Building  a 
Scatterplot 


APPLET 

Ahora  es  oportuno  que  usted  trate  de  generar  una  grafica  propia.  Use  los  applets  en 
Building  a  Scatterplot  (Construyendo  una  grafica  de  dispersion)  para  crear  las 
graficas  de  dispersion  que  se  muestran  en  las  figuras  3.5  y  3.7.  Encontrara  instruccio- 
nes  paso  a  paso  en  el  lado  izquierdo  del  applet  (figura  3.6)  y  se  le  corregira  si  comete 
un  error. 


The  point  for  the  first 
observation  is (10.0,  23.0). 
Place  a  point  on  the  graph 
by  clicking  your  mouse  in 
the  column  for  10.0  (green 
line)  and  the  row  for  23.0 
(red  line).  The  blue  numbers 
sh  oiai  cu  rre  nt  (co  I  u  m  n .  row). 


Due  to  screen  resol uti on, 
the  cursor  sometimes 
cannot  be  exactl  y  on  the 
data  point.  Therefore,  this 
graph  ■'/■/ill  allow  you  to  be  a 
little  bit  sloppy. 


Cases 

26.0 


24.0 


22.0 


20.0 


18.0 


16.0 


14.0, 


.0  10 

1.0  11.0  12.0  13.0  14.0  15 
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MEDIDAS  NUMERICAS  PARA  DATOS 
CUANTITATIVOS  BIVARIADOS 

Una  tasa  constante  de  aumento  o  disminucion  es  quiza  el  modelo  mas  comun  que  se 
encuentra  en  graficas  de  dispersion  bivariadas.  La  grafica  de  dispersion  de  la  figura  3.4 
exhibe  este  modelo  lineal,  es  decir,  una  recta  con  los  puntos  de  datos  arriba  y  debajo  de 
la  recta  y  a  no  mas  de  una  distancia  fija  desde  la  recta.  Cuando  este  es  el  caso,  decimos 
que  las  dos  variables  exhiben  una  relacion  lineal. 

Los  datos  de  la  tabla  3.5  son  la  superficie  del  area  de  descanso  (en  pies  cuadrados),  x,  y 
el  precio  de  venta,  y,  de  12  residencias.  La  grafica  de  dispersion  del  MINITAB  de  la  figura 
3.7  muestra  un  modelo  lineal  en  los  datos. 


TABLA  3.5  Area  de  descanso  y  precio  de  venta  de  12  propiedades 

Residencia  x (pies  cuadrados)  y  (en  miles) 


1 

1360 

$278.5 

2 

1940 

375.7 

3 

1750 

339.5 

4 

1550 

329.8 

5 

1790 

295.6 

B 

1750 

310.3 

7 

2230 

460.5 

8 

1600 

305.2 

9 

1450 

288.6 

10 

1870 

365.7 

11 

2210 

425.3 

12 

1480 

268.8 

Para  los  datos  del  ejemplo  3.5,  se  podrfa  describir  individualmente  cada  variable,  x  y 
y,  usando  medidas  descriptivas  como  lo  son  las  medias  x  y  y  o  las  desviaciones  estandar 
(sx  y  sy).  No  obstante,  estas  medidas  no  describen  la  relacion  entre  x  y  y  para  una  residen¬ 
cia  en  particular,  es  decir,  la  forma  en  que  el  tamano  del  espacio  de  descanso  afecta  el 
precio  de  venta  de  la  casa.  Una  medida  sencilla  que  sirve  a  este  proposito  se  denomina 
coeficiente  de  correlacion,  denotado  por  r,  y  se  define  como 

$xy 

SxSy 
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Las  cantidades  sx  y  sy  son  las  desviaciones  estandar  para  las  variables  x  y  y,  respecti- 
vamente,  que  usted  puede  hallar  si  usa  la  funcion  de  estadisdca  de  su  calculadora  o  la 
formula  computacional  de  la  section  2.3.  La  nueva  cantidad  sxy  se  denomina  covarianza 
entre  x  y  y,  y  esta  definida  como 

_  %(x,  -x)(y,  -y) 

Sjcy  -t 

n  —  1 

Tambien  hay  una  formula  computacional  para  la  covarianza: 

v  (SxiXSy,) 

- - Tl - 


donde  es  la  suma  de  los  productos  x,v,  para  cada  uno  de  los  n  pares  de  mediciones. 
^En  que  forma  esta  cantidad  detecta  y  mide  un  modelo  lineal  de  los  datos? 

Observe  los  signos  de  los  productos  cruz  (x,  —  x)  (y,  —  y)  del  numerador  de  r,  o  sea 
Sxy.  Cuando  un  punto  de  datos  (x,  y)  se  encuentre  en  el  area  I  o  III  de  la  grafica  de  dis¬ 
persion  que  se  muestra  en  la  figura  3.8,  el  producto  cruz  sera  positivo;  cuando  un  punto 
de  datos  este  en  el  area  II  o  IV,  el  producto  cruz  sera  negativo.  Podemos  sacar  estas 
conclusiones: 

•  Si  casi  todos  los  puntos  estan  en  las  areas  I  y  III  (formando  un  modelo  positivo), 
Sxy  y  r  seran  positivos. 

•  Si  casi  todos  los  puntos  estan  en  las  areas  II  y  IV  (formando  un  modelo  negati¬ 
vo),  s^yr  seran  negativos. 

•  Si  los  puntos  estan  dispersos  en  las  cuatro  areas  ( sin  formar  modelo),  sxy  y  r  seran 
cercanos  a  0. 


FIGURA  3.8 

Los  signos  de  los 
productos  cruz  lx,  —  x) 
(/,  —  y )  de  la  formula  de 
covarianza. 


El  applet  llamado  Exploring  Correlation  (Exploration  de  correlation)  ayudara  a 
visualizar  la  forma  en  que  el  modelo  de  puntos  afecta  al  coeficiente  de  correlacion. 
Use  su  mouse  para  mover  el  apuntador  en  la  parte  inferior  de  la  grafica  de  dispersion 
(figura  3.9).  Vera  que  el  valor  de  r  cambia  cuando  cambia  el  modelo  de  los  puntos. 
Observe  que  un  modelo  positivo  a)  resulta  en  un  valor  positivo  de  r;  cuando  no  hay 
modelo  c)  se  obtiene  un  valor  de  r  cercano  a  cero;  un  modelo  negativo  b)  resulta  en 
un  valor  negativo  de  r.  ^Que  modelo  se  muestra  cuando  r  =  I  ?  i  Y  cuando  r  =  —  1? 
Usted  empleara  este  applet  otra  vez  para  la  section  de  Ejercicios  de  MiApplet  al  final 
de  este  capitulo. 
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a)  Modelo  positivo  b)  Modelo  negativo  c)  Sin  modelo 
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FIGURA  3.9 

Applet  llamado  Exploring 
Correlation 


CONSEJO 


r  >  0  <=>  relacion  lineal 
positiva 


r<  0  «•  relacion  lineal 
negativa 


r»Oono  hay  relacion 


y 

100.0 


80.0 

60.0 

40.0 

20.0 


0.0 
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Switch  Sign 


Casi  todas  las  calculadoras  cientfficas  y  de  graficas  pueden  calcular  el  coeficiente  de 
correlacion,  r,  cuando  los  datos  se  introducen  en  la  forma  correcta.  Verifique  el  manual 
de  su  computadora  para  la  secuencia  apropiada  de  comandos  de  entrada.  Los  programas  de 
computadora  como  el  MINITAB  tambien  estan  programados  para  realizar  estos  calculos. 
La  salida  MINITAB  de  la  figura  3.10  muestra  la  covarianza  y  coeficiente  de  correlacion 
para  x  y  y  del  ejemplo  3.5.  En  la  tabla  de  covarianza,  encontrara  estos  valores: 

5^=  15545.20  5*  =  79233.33  s2y  =  3571.16 

y  en  la  salida  de  correlacion  encontrara  r  =  .924. 

De  cualquier  modo  que  usted  decida  calcular  el  coeficiente  de  correlacion,  se  puede 
demostrar  que  el  valor  de  r  siempre  esta  entre  —  1  y  1 .  Cuando  r  es  positiva,  x  aumenta 
cuando  y  aumenta,  y  viceversa.  Cuando  r  es  negativa,  x  disminuye  cuando  y  aumenta, 
o  x  aumenta  cuando  y  disminuye.  Cuando  r  toma  el  valor  de  1  o  —  1,  todos  los  puntos 
estan  exactamente  en  una  recta.  Si  r  =  0,  entonces  no  hay  relacion  lineal  aparente  entre 
las  dos  variables.  Cuanto  mas  cercano  sea  el  valor  de  r  a  1  o  a  —  1,  sera  mas  fuerte  la 
relacion  lineal  entre  las  dos  variables. 


FIGURA  3.10 

Salida  del  MINITAB  de 

Covarianzas: 

x,y 

Correlaciones:  x,  y 

covarianza  y  correlacion 
para  el  ejemplo  3.5 

X 

y 

x  79233.33 
y  15545.20 

3571 . 16 

Pearson  correlation  of  x  and  y  =  0.924 
P-Value  =  0.000 

EJEMPLO 


Encuentre  el  coeficiente  de  correlacion  para  el  numero  de  pies  cuadrados  de  area  de 
descanso  y  el  precio  de  venta  de  una  casa  para  los  datos  del  ejemplo  3.5. 


Solucion  Se  necesita  de  tres  cantidades  para  calcular  el  coeficiente  de  correlacion. 
Las  desviaciones  estandar  de  las  variables  x  y  y  se  encuentran  usando  una  calculadora 
con  una  funcion  estadistica.  Se  puede  verificar  que  sx  =  281.4842  y  sy  =  59.7592.  Por 
ultimo, 
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x"explica"  y o  /"depende 
de"  x. 


xes  la  variable  explicativa  o 

independiente. 

yes  la  respuesta  o  variable 

dependiente. 


FIGURA  3.1  1 

Grafica  de  una  recta 


(2x,)(2v,) 


n  —  1 
7240383  - 


(20980X4043.5) 

12 


11 


=  15545.19697 


Esto  concuerda  con  el  valor  dado  en  la  salida  MINITAB  de  la  figura  3.10.  Entonces 


15545.19697 


SxSy  (281.4842)(59.7592) 


=  .9241 


que  tambien  concuerda  con  el  valor  del  coeficiente  de  correlacion  dado  en  la  figura  3.10. 
(Se  puede  verificar  el  valor  de  r  usando  una  calculadora.)  Este  valor  de  r  es  bastante 
cercano  a  1,  lo  cual  indica  que  la  relacion  lineal  entre  estas  dos  variables  es  muy  fuerte. 
En  el  capftulo  12  se  puede  encontrar  mas  informacion  acerca  del  coeficiente  de  corre¬ 
lacion  y  su  papel  para  analizar  relaciones  lineales,  junto  con  formulas  computacionales 
alternativas. 


A  veces  las  dos  variables,  x  y  y,  estan  relacionadas  de  una  forma  particular.  Puede  ser 
que  el  valor  de  y  dependa  del  valor  de  x\  esto  es,  el  valor  de  x  en  alguna  forma  explica 
el  valor  de  y.  Por  ejemplo,  el  costo  de  una  casa  (y)  puede  depender  de  su  superficie  de 
piso  (x) ;  el  promedio  de  puntos  de  calificacion  de  una  estudiante  (x)  puede  explicar  su 
calificacion  en  un  examen  vocacional  (y).  En  estas  situaciones,  y  se  denomina  variable 
dependiente,  en  tanto  que  x  es  la  variable  independiente. 

Si  una  de  las  dos  variables  se  puede  clasificar  como  la  variable  dependiente  y  y  la  otra 
como  x,  y  si  los  datos  exhiben  un  modelo  de  ltnea  recta,  es  posible  describir  la  relacion 
que  vincula  yai  usando  una  ltnea  recta  dada  por  la  ecuacion 

y  =  a  +  bx 

como  se  muestra  en  la  figura  3.11. 


Como  se  puede  ver,  a  es  donde  la  recta  cruza  o  interseca  al  eje  y:  a  se  denomina 
intersection  y.  Tambien  se  puede  ver  que  para  todo  aumento  unitario  en  x,  y  aumenta  en 
una  cantidad  de  b.  La  cantidad  b  determina  si  la  recta  esta  aumentando  (b  >  0),  dismi- 
nuyendo  (b  <  0)  o  es  horizontal  (b  =  0)  y  muy  adecuadamente  se  denomina  pendiente 
de  la  recta. 
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Se  puede  ver  el  efecto  de  cambiar  la  pendiente  y  la  intersection  y  de  una  recta  si  se  usa 
el  applet  llamado  How  a  Line  Works  (como  funciona  una  recta).  Use  su  mouse 
para  mover  el  apuntador  en  el  lado  derecho  de  la  grafica  de  dispersion.  Cuando 
se  mueva  el  apuntador,  cambiara  la  pendiente  de  la  recta  que  se  muestra  como  el  la¬ 
do  vertical  del  triangulo  verde  (gris  claro  en  la  figura  3.12).  Moviendo  el  apuntador  en  el 
lado  izquierdo  del  applet  hace  que  cambie  la  intersection  y,  mostrada  en  rojo  (azul 
en  la  figura  3.12).  ^Cual  es  la  pendiente  e  intersection  y  para  la  recta  que  se  mues¬ 
tra  en  el  applet  de  la  figura  3.12?  Usted  usara  este  applet  otra  vez  para  la  section  de 
Ejercicios  Mi  Applet  del  final  de  este  capitulo. 


FIGURA  3.1  2 

Applet  llamado  How  a 
Line  Works 


Nuestros  puntos  (x,  y)  no  caen  en  una  recta,  pero  muestran  una  tendencia  que  podrfa 
describirse  como  modelo  lineal.  Podemos  describir  esta  tendencia  si  ajustamos  una  rec¬ 
ta  a  los  puntos  en  la  mejor  forma  que  podamos.  Esta  recta  de  mejor  ajuste  que  relaciona 
a  y  con  x  y  que  se  denomina  recta  de  regresion,  o  recta  de  mmimos  cuadrados,  se 
encuentra  al  reducir  al  mi'nimo  la  suma  de  las  diferencias  cuadradas  entre  los  puntos  de 
datos  y  la  recta  misma,  como  se  muestra  en  la  figura  3.13.  Las  formulas  para  calcular  b 
y  a,  que  se  derivan  matematicamente,  se  muestran  a  continuation. 


FORMULAS  COM PUTACION ALES  PARA  LA  RECTA 
DE  REGRESION  DE  MINIMOS  CUADRADOS 


y  la  recta  de  regresion  de  mmimos  cuadrados  es:  y  =  a  +  bx 
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CONSEJO 


Recuerde  que  ry  fatienen  el 
mismo  signo. 


EJEMPLO 


Como  sx  y  sy  son  positivas,  by  r  tienen  el  mismo  signo,  de  modo  que: 

•  Cuando  r  es  positiva,  tambien  lo  es  b.  y  la  recta  es  creciente  con  x. 

•  Cuando  r  es  negativa,  tambien  lo  es  b,  y  la  recta  es  decreciente  con  x. 

•  Cuando  r  es  cercana  a  0,  entonces  b  es  cercana  a  0. 

Encuentre  la  recta  de  mejor  ajuste  que  relacione  y  =  salario  inicial  por  hora  con  x  = 
numero  de  anos  de  experiencia  en  el  trabajo  para  los  datos  siguientes.  Grafique  la  recta 
y  los  puntos  de  datos  en  la  misma  grafica. 


X 

2 

3 

4 

5 

6 

7 

y 

$6.00 

7.50 

8.00 

12.00 

13.00 

15.50 

Solucion  Use  el  metodo  de  introducir  datos  en  su  calculadora  para  hallar  estas  esta- 
disticas  descriptivas  para  el  conjunto  de  datos  bivariados: 


Use  la  recta  de  regresion 
para  predecir  ypara  un  valor 
determinado  de  x. 


x  =  4.5  y  =  10.333  5,  =  1.871  =  3.710  r  =  .980 

Entonces 

b  =  r(SA  =  ,98of =  1.9432389  «  1.943 
\sx)  \  1-871/ 


y 


a  =y  —  bx  =  10.333  -  1.943(4.5)  =  1.590 

Por  lo  tanto,  la  recta  de  mejor  ajuste  es  y  =  1.590  +  1.943x  La  grafica  de  la  recta  de 
regresion  y  los  puntos  reales  de  datos  se  muestran  en  la  figura  3.14. 

La  recta  de  mejor  ajuste  se  puede  usar  para  estimar  o  predecir  el  valor  de  la  variable 
y  cuando  se  conoce  el  valor  de  x.  Por  ejemplo,  si  una  persona  que  solicita  un  empleo 
tiene  tres  anos  de  experiencia  en  el  trabajo  (x),  ^cual  serfa  el  sueldo  inicial  por  hora  (v) 
que  pronosticarfa  usted?  De  la  recta  de  mejor  ajuste  de  la  figura  3.14,  la  mejor  estima- 
cion  serfa 

y  =  a  +  bx  =  1.590  +  1.943(3)  =  7.419 
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ENTRENADOR  PERSONAL 

^Corno  calculo  el  coeficiente  de  correlacion? 

1 .  Primero,  genere  una  tabla  o  use  su  calculadora  para  hallar  Xx,  Xy  y  Xxy. 

2.  Calcule  la  covarianza,  ,vxy. 

3.  Use  su  calculadora  o  la  formula  computacional  del  capftulo  2  para  calcular  sx 

y  sr 

4.  Calcule  r  =  — — . 


^Como  calculo  la  recta  de  regresion? 

_  _  Sx y 

1 .  Primero,  calcule  yyx.A  continuacion,  calcule  r  =  — — 


2.  Encuentre  la  pendiente,  b  =  r(  —  ]  y  la  interseccion  y,  a  =  y  —  bx. 

3.  Escriba  la  recta  de  regresion  al  sustituir  valores  de  a  y  b  en  la  ecuacion: 
y  =  a  +  bx. 


Repertorio  de  ejercicios 

A.  A  continuacion  aparece  un  conjunto  sencillo  de  datos  bivariados.  Llene  los  espa- 
cios  en  bianco  para  hallar  el  coeficiente  de  correlacion. 


X 

V 

xy 

Calcule: 

Covarianza 

0 

1 

n  = 

<Sx)(2x) 

2 

5 

S„  = 

n 

Sxy 

n  —  1 

4 

2 

Sy  ~ 

Coeficiente  de  correlacion 

SX  = 

Sj /  = 

1xy  = 

Sxy 

SxSy 

B.  Use  la  informacion  de  la  parte  A  y  encuentre  la  recta  de  regresion. 


De  la  parte  A 

De  la  parte  A 

Calcule: 

Pendiente 

Interseccion  y 

s„  = 

X  = 

fi=r(^  = 

2y  = 

s,= 

y  = 

UJ 

a  =  y  -  hx  = 

r  = 

Recta  de  regresion:  y  = 

Las  respuestas  se  encuentran  al  final  de  este  libro. 


^Cuando  se  debe  describir  la  relacion  lineal  entre  .r  y  y  usando  el  coeficiente  de  corre¬ 
lacion  r,  y  cuando  se  debe  usar  la  recta  de  regresion  y  =  a  +  abl  El  metodo  de  regresion 
se  usa  cuando  los  valores  de  x  se  fijan  por  anticipado  y  entonces  se  mide  el  valor  corres- 
pondiente  de  y.  El  metodo  de  correlacion  se  emplea  cuando  se  selecciona  una  unidad 
experimental  al  azar  y  luego  se  hacen  mediciones  en  las  variables  xy  y.  Este  punto  tec- 
nico  se  retoma  en  el  capftulo  12,  que  aborda  el  analisis  de  regresion. 
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La  mayoria  de  analistas  de  datos  inician  cualquier  investigation  basada  en  datos  al 
examinar  graficas  de  las  variables  involucradas.  Si  la  relation  entre  dos  variables  es  de 
interes,  los  analistas  de  datos  tambien  pueden  explorar  graficas  bivariadas  en  conjuncion 
con  medidas  numericas  de  ubicacion,  dispersion  y  correlation.  Las  graficas  y  medi- 
das  descriptivas  son  solo  las  primeras  de  numerosas  herramientas  estadisticas  que  usted 
pronto  tendra  a  su  disposition. 


0 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estas preguntas  se  refieren  a  la  seccion  Mi  Entrenador  Personal  de  la  pagina  111. 

3.9  A  continuation  se  encuentra  un  conjunto  sencillo  de  datos  bivariados.  Llene  los 
espacios  para  hallar  el  coeficiente  de  correlacion. 


X 

V 

xy 

Calcule: 

Covarianza 

1 

6 

n  = 

(2x)(2x) 

3 

2 

Sx  = 

x*y  n 

Sxy 

n  —  1 

2 

4 

sv  = 

Coeficiente  de  correlacion 

Xx  = 

1y  = 

1xy  = 

_??L  = 

sxsr 

3.10  Use  la  information  del  ejercicio  3.9  y  encuentre  la  recta  de  regresion. 


De  la  parte  A 

De  la  parte  A 

Calcule: 

Pendiente 

Interseccion  y 

2x  = 

Sx  = 

X  = 

b-r(SA~ 

2k  = 

Sy  = 

y= 

UJ 

a  =  y  —  bx  = 

r  = 

Recta  de  regresion:  y  = 

TECNICAS  BASICAS 

(^) datos  3.11  Un  conjunto  de  datos  bivariados  consta 
de  estas  mediciones  en  dos  variables,  x  y  y: 

(3,6)  (5,8)  (2,6)  (1,4)  (4,7)  (4,6) 

a.  Trace  una  grafica  de  dispersion  para  describir  los 
datos. 

b.  Parece  haber  una  relacion  entre  x  y  y?  Si  es  asi, 
£como  la  describe? 

c.  Calcule  el  coeficiente  de  correlacion,  r,  usando  la 
formula  computacional  dada  en  esta  seccion. 

d.  Encuentre  la  recta  de  mejor  ajuste  usando  las  formulas 
computacionales.  Grafique  la  recta  en  la  grafica  de 
dispersion  del  inciso  a).  ^La  recta  pasa  por  en  medio 
de  los  puntos? 


3.12  Consulte  el  ejercicio  3.1 1. 

a.  Use  el  metodo  de  introducir  datos  en  su  calculadora 
cientifica  para  ingresar  los  seis  pares  de  mediciones. 
Recuerde  las  memorias  apropiadas  para  hallar  el 
coeficiente  de  correlacion,  r,  la  interseccion  v,  y  la 
pendiente,  b,  de  la  recta. 

b.  Verifique  que  la  calculadora  de  los  mismos  valores 
para  r,  ay  b  que  en  el  ejercicio  3.11. 

(^) datos  3.13  Considere  este  conjunto  de  datos 
bivariados: 


X 

1  2 

3 

4 

5 

6 

V 

5.6  4.6 

4.5 

3.7 

3.2 

2.7 

a.  Trace  una  grafica  de  dispersion  para  describir  los 
datos. 
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b.  ^Parece  haber  una  relacion  entre  x  y  y?  Si  es  asf, 
^como  la  describe  usted? 

c.  Calcule  el  coeficiente  de  correlacion,  r.  (jLI  valor  de 
r  confirma  las  conclusiones  de  usted  en  el  inciso  b)? 
Explique. 

datos  3.14  El  valor  de  una  variable  cuantitativa  se 
mide  una  vez  al  ano  durante  un  periodo  de  10 
anos: 


Ano 

Medicion 

Ano 

Medicion 

1 

61.5 

6 

58.2 

2 

62.3 

7 

57.5 

3 

60.7 

8 

57.5 

4 

59.8 

9 

56.1 

5 

58.0 

10 

56.0 

a.  Trace  una  grafica  de  dispersion  para  describir  la 
variable  cuando  cambie  con  el  tiempo. 

b.  Describa  las  mediciones  usando  la  grafica  construida 
en  el  inciso  a). 

c.  Use  esta  salida  MINITAB  para  calcular  el  coeficiente  de 
correlacion,  r. 

Salida  MINITAB  para  el  ejercicio  3.14 

Covarianzas 

x  y 

X  9.16667 

y  -6.42222  4.84933 

d.  Encuentre  la  recta  de  mejor  ajuste  usando  los 
resultados  del  inciso  c).  Verifique  su  respuesta  usando 
el  metodo  de  entrada  de  datos  en  su  calculadora. 

e.  Grafique  la  recta  de  mejor  ajuste  en  su  grafica  de 
dispersion  del  inciso  a).  Describa  el  ajuste  de  la  recta. 


APLICACIONES 

(^)datos  3.15  Costos  de  alimentos  Estos  datos  que 
relacionan  la  cantidad  gastada  en  alimentos  por 
semana  y  el  ntimero  de  miembros  de  una  familia  son  del 
ejemplo  3.3: 


x  2  2  3  4 _ 1 _ 5 

y  $95.75  $110.19  $118.33  $150.92  $85.86  $180.62 


a.  Encuentre  la  recta  de  mejor  ajuste  para  estos  datos. 

b.  Grafique  los  puntos  y  la  recta  de  mejor  ajuste  en  la 
misma  grafica.  ^La  recta  resume  la  information  de  los 
puntos  de  datos? 

c.  i Que  estimana  usted  que  gasta  por  semana  una  familia 
de  seis  en  alimentos?  (,Dcbc  usar  la  recta  ajustada  para 
estimar  esta  cantidad?  ^Por  que  sf  o  por  que  no? 

(^)datos  3.16  Precios  de  bienes  raices  Los 

datos  que  relacionan  los  pies  cuadrados  de 
espacio  de  vivienda,  asf  como  el  precio  de  venta  de  12 
propiedades  residenciales  del  ejemplo  3.5,  se  reproducen 


a  continuation.  Primero,  encuentre  la  recta  de  mejor 
ajuste  que  describa  estos  datos  y  luego  grafique  la  recta  y 
los  puntos  de  datos  en  la  misma  grafica.  Comente  sobre 
la  bondad  de  la  recta  ajustada,  describiendo  el  precio  de 
venta  de  una  propiedad  residencial  como  una  funcion 
lineal  de  los  pies  cuadrados  de  area  de  vivienda. 


Residencia  x  (pies2)  )/ (en  miles) 


1 

2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 


1360 

$278.5 

1940 

375.7 

1750 

339.5 

1550 

329.8 

1790 

295.6 

1750 

310.3 

2230 

460.5 

1600 

305.2 

1450 

288.6 

1870 

365.7 

2210 

425.3 

1480 

268.8 

(^)datos  3.17  Estudiantes  incapacitados 

Un  programa  de  entrenamiento  de  habilidades 
sociales,  publicado  en  Psychology  in  the  Schools,  fue 
puesto  en  practica  para  siete  estudiantes  con  males 
benignos,  en  un  estudio  para  determinar  si  el  programa 
causo  mejorfa  en  medidas  previas  o  posteriores  y  en 
valoraciones  de  conducta.5  Para  un  examen,  estas  son  las 
calificaciones  antes  y  despues  de  los  examenes  para  siete 
estudiantes: 


Estudiante  Antes  Despues 

Earl  101  113 

Ned  89  89 

Jasper  112  121 

Charlie  105  99 

Tom  90  104 

Susie  91  94 

Lori  89  99 

a.  Trace  una  grafica  de  dispersion  que  relacione  la 
calificacion  despues  del  examen  con  la  de  antes  del 
examen. 

b.  Describa  la  relacion  entre  calificaciones  antes  y 
despues  del  examen,  usando  la  grafica  del  inciso  a). 

;  Vc  usted  alguna  tendencia? 

c.  Calcule  el  coeficiente  de  correlacion  e  interprete  o 
describa  su  valor.  ^Refuerza  esto  alguna  relacion  que 
era  evidente  desde  la  grafica  de  dispersion?  Explique. 

(I datos  3.18  Lexus,  Inc.  Los  fabricantes  del  auto 

Lexus  han  aumentado  continuamente  sus  ventas 
desde  el  lanzamiento  que  hicieron  en  Estados  Unidos  en 
1989.  No  obstante,  el  porcentaje  de  aumento  cambio 
en  1996  cuando  Lexus  introdujo  una  lrnea  de  camiones. 
Las  ventas  del  Lexus  de  1996  a  2005  se  muestran  en  la 
tabla  siguiente.6 
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Ano 

1996 

1997 

1998 

1999 

2000 

2001 

2002 

2003 

2004 

2005 

Ventas  (miles 

80 

100 

155 

180 

210 

224 

234 

260 

288 

303 

de  vehlculos) 

Fuente:  Adaptado  de  Automotive  News,  enero  26, 2005  y  mayo  22, 2006. 

a.  Grafique  los  datos  usando  una  grafica  de  dispersion. 
/Como  describina  usted  la  relacion  entre  ano  y  ventas 
del  Lexus? 

b.  Encuentre  la  recta  de  regresion  de  mmimos  cuadrados 
que  relacione  las  ventas  del  Lexus  con  el  ano  que  se 
mide. 

c.  Si  usted  tuviera  que  predecir  las  ventas  del  Lexus  en 
el  ano  2015,  /que  problemas  podrian  surgir  con  su 
prediccion? 

datos  3.19  Televisores  de  alta  definicion, 

otra  vez  En  el  ejercicio  2.12,  Consumer 
Reports  dio  los  precios  para  los  principales  10  televisores 
de  pantalla  de  cristal  liquido  y  alta  definicion,  en  la 
categorfa  de  30  a  40  pulgadas.  /El  precio  de  un  televisor 
de  pantalla  de  cristal  liquido  depende  del  tamano  de  esta? 
La  tabla  siguiente  muestra  los  10  costos  otra  vez,  junto 
con  el  tamano  de  la  pantalla.6 


Marca 

Precio 

Tamano 

JVC  LT-40FH96 

$2900 

40" 

Sony  Bravia  KDL-V32XBR1 

1800 

32" 

Sony  Bravia  KDL-V40XBR1 

2600 

40" 

Toshiba  37HLX95 

3000 

37" 

Sharp  Aquos  LC-32DA5U 

1300 

32" 

Sony  Bravia  KLV-S32A10 

1500 

32" 

Panasonic  Viera  TC-32LX50 

1350 

32" 

JVC  LT-37X776 

2000 

37" 

LG  37LP1D 

2200 

37" 

Samsung  LN-R328W 

1200 

32" 

a.  /Cual  de  las  dos  variables  (precio  y  tamano)  es 
la  variable  independiente,  y  cual  es  la  variable 
dependiente? 

b.  Construya  una  grafica  de  dispersion  para  los  datos. 

/La  relacion  parece  lineal? 

3.20  Televisores  de  alta  definicion, 

continua  Consulte  el  ejercicio  3.19.  Imagine  que  damos 

por  hecho  que  la  relacion  entre  x  y  y  es  lineal. 

a.  Encuentre  el  coeficiente  de  correlacion,  r.  /Que  le 
dice  este  valor  acerca  de  la  fuerza  y  direccion  de  la 
relacion  entre  tamano  y  precio? 

b.  /Cual  es  la  ecuacion  de  la  recta  de  regresion  empleada 
para  predecir  el  precio  del  televisor,  con  base  en  el 
tamano  de  la  pantalla? 

c.  La  Sony  Corporation  esta  introduciendo  un  nuevo 
televisor  de  37"  de  pantalla  de  cristal  liquido.  /  Cual 
pronostica  usted  que  sera  su  precio? 

d.  /Sena  razonable  tratar  de  predecir  el  precio  de 
un  televisor  de  45"  de  pantalla  de  cristal  liquido? 
Explique. 


REPASO  DEL  CAPITULO 


Conceptos  clave 

I.  Datos  bivariados 

1.  Variables  cualitativas  y  cuantitativas 

2.  Describir  separadamente  cada  variable 

3.  Describir  la  relacion  entre  las  dos  variables 

II.  Describir  dos  variables  cualitativas 

1 .  Graficas  de  pastel  una  al  lado  de  otra 

2.  Graficas  de  lineas  comparativas 


3.  Graficas  comparativas  de  barras 

a.  Lado  a  lado 

b.  Apiladas 

4.  Frecuencias  relativas  para  describir  la  relacion 
entre  las  dos  variables 

III.  Describir  dos  variables  cuantitativas 

1 .  Graficas  de  dispersion 
a.  Modelo  lineal  o  no  lineal 
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b.  Fuerza  de  relation 

c.  Observaciones  poco  comunes:  conglomerados 
y  resultados  atipicos 

2.  Covarianza  y  coeficiente  de  correlation 


3.  La  recta  de  regresion  de  mejor  ajuste 

a.  Calcular  la  pendiente  e  intersection  y 

b.  Graficar  la  recta 

c.  Usar  la  recta  para  prediction 


Descripcion  de  datos  bivariados 


El  MINITAB  contiene  diferentes  tecnicas  graficas  para  datos  bivariados  cualitativos  y 
cuantitativos,  asi  como  comandos  para  obtener  medidas  descriptivas  bivariadas  cuando 
los  datos  son  cuantitativos.  Para  explorar  ambos  tipos  de  procedimientos  bivariados,  es 
necesario  introducir  dos  conjuntos  diferentes  de  datos  bivariados  en  una  hoja  de  trabajo 
MINITAB.  Una  vez  que  usted  tenga  a  la  vista  el  escritorio  de  Windows,  haga  doble  clic  en 
el  icono  MINITAB  o  utilice  el  boton  Start  para  iniciar  el  MINITAB. 

Inicie  un  nuevo  proyecto  usando  File  — >  New  — »  Minitab  Project.  A  continuation 
abra  el  proyecto  existente  llamado  “Chapter  1”.  Usaremos  los  datos  del  estudiante  uni- 
versitario,  que  debe  estar  en  la  Hoja  de  Trabajo  (Worksheet)  1.  Suponga  que  los  105  estu- 
diantes  ya  tabulados  fueran  de  la  Universidad  de  California,  en  Riverside  y  que  otros  100 
estudiantes  de  una  clase  de  introduction  a  la  estadlstica  en  la  Universidad  de  California, 
en  Berkeley  (UCR),  tambien  fueron  entrevistados.  La  tabla  3.6  muestra  la  distribution  de 
estatus  para  ambos  conjuntos  de  estudiantes.  Genere  otra  variable  en  C3  de  la  hoja 
de  trabajo  llamada  “College”  (Universidad)  e  introduzca  la  UCR  para  los  primeros  cinco 
renglones.  A  continuation  introduzca  los  datos  de  la  UCB  en  las  columnas  C1-C3.  Pue- 
de  usar  los  ya  conocidos  iconos  Windows  de  copiar  y  pegar  si  as!  lo  desea. 


TABLA  3.6 


Primer  ano  Segundo  ano  Penultimo  ano  Ultimo  ano  Graduado 

Frecuencia  (UCR)  5  23  32  35  10 

Frecuencia  (UCB)  10  35  24  25  6 


La  otra  hoja  de  trabajo  en  “Chapter  1”  no  es  necesaria  y  puede  ser  eliminada  al  dar 
un  clic  en  la  X  de  la  esquina  superior  derecha  de  la  hoja  de  trabajo.  Usaremos  la  hoja  de 
trabajo  llamada  “Minivans”  del  capitulo  2,  que  usted  debe  abrir  usando  File  — >  Open 
Worksheet  y  seleccionando  “Minivans. mtw”.  Ahora  guarde  este  nuevo  proyecto  como 
“Chapter  3”. 

Para  describir  graficamente  los  datos  de  estudiantes  de  las  UCR/UCB,  usted  puede 
usar  graficas  comparativas  de  pastel,  una  para  cada  escuela  (vease  el  capitulo  1).  De  ma- 
nera  optional,  puede  usar  ya  sea  graficas  de  barras  apiladas  o  de  lado  a  lado.  Use  Graph 
Bar  Chart.  En  el  cuadro  de  dialogo  “Bar  Charts”  (figura  3.15),  seleccione  Values  from 
a  tabla  de  la  lista  descendente  y  de  un  clic  ya  sea  en  Stack  o  en  Cluster  en  el  renglon 
marcado  “One  Column  of  Values”.  De  un  clic  en  OK.  En  el  siguiente  cuadro  de  dialogo 
(figura  3.16),  seleccione  “Frequency”  para  la  caja  Graph  variables  y  “Status”  y  “Co¬ 
llege”  para  la  caja  Categorical  variable  for  grouping.  De  un  clic  en  OK.  Una  vez  que 
la  grafica  de  barras  se  exhiba  (figura  3.17),  puede  usted  dar  un  clic  derecho  en  varios 
elementos  de  la  grafica  de  barras  para  editarlos.  Si  da  un  clic  derecho  en  las  barras  y 
selecciona  Update  Graph  Automatically,  la  grafica  de  barras  se  actualiza  en  forma 
automatica  cuando  usted  cambie  los  datos  de  la  hoja  de  trabajo  Minitab. 
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FIGURA  3.1  5 
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FIGURA  3.1  6 


www.FreeLibros.me 


Ml  MINITAB  O  117 


FIGURA  3.1  7 


Pase  a  la  Hoja  de  Trabajo  (Worksheet)  2,  en  la  cual  se  encuentran  los  datos  bivariados 
de  las  minivan  del  capitulo  2.  Para  examinar  la  relacion  entre  las  longitudes  de  asiento 
segunda  y  tercera  fila,  se  pueden  graficar  los  datos  y  numericamente  describir  la  relacion 
con  el  coeficiente  de  correlacion  y  la  recta  de  mejor  ajuste.  Use  Stat  — >  Regression  —> 
Fitted  Line  Plot,  y  seleccione  “2nd  Seat”  y  “3rd  Seat”  para  Y  y  X,  respectivamente 
(vease  la  figura  3.18).  Asegurese  de  seleccionar  el  punto  junto  a  Linear  y  de  un  clic  en 
OK.  La  grafica  de  los  nueve  puntos  de  datos  y  la  recta  de  mejor  ajuste  seran  generados 
como  en  la  figura  3.19. 


FIGURA  3.18 
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FIGURA  3.1  9 


Para  calcular  el  coeficiente  de  correlacion,  use  Stat  — »  Basic  Statistics  — »  Correla¬ 
tion,  seleccionando  “2nd  Seat”  y  “3rd  Seat”  para  la  caja  de  Variables.  Para  seleccionar 
ambas  variables  a  la  vez,  mantenga  pulsada  la  tecla  Shift  (Mayusculas)  cuando  selec- 
cione  las  variables  y  luego  de  un  clic  en  Select.  De  un  clic  en  OK,  y  el  coeficiente  de 
correlacion  aparecera  en  la  ventana  Session  (vease  la  figura  3.20).  Observe  la  correla¬ 
cion  positiva  relativamente  fuerte  y  la  pendiente  positiva  de  la  recta  de  regresion,  lo  cual 
indica  que  un  minivan  con  gran  longitud  de  piso  detras  del  segundo  asiento  tambien 
tendera  a  tener  una  gran  longitud  de  piso  detras  del  tercer  asiento. 

Guarde  “Chapter  3”  antes  de  salir  de  MINITAB. 


FIGURA  3.20 


1 

Correlations:  2nd  Seat.  3rd  Seat 

Pearson  correlation  of  2nd  Seat  and  3rd  Seat  -  0.844 

v-vaiue  *  U.UU4 
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EJercicios  suplementarios 


3.21  Profesor  Asimov  El  profesor  Isaac  Asimov  fue 
uno  de  los  escritores  mas  prolfficos  de  todos  los  tiempos. 
Escribio  cerca  de  500  libros  durante  una  carrera  de  40 
anos  antes  de  su  muerte  en  1992.  De  hecho,  a  medida  que 
su  carrera  avanzaba,  fue  mas  productivo  en  terminos  del 
numero  de  libros  escritos  en  un  periodo  determinado.8 
Los  datos  siguientes  son  los  tiempos  (en  meses) 
requeridos  para  escribir  sus  libros,  en  incrementos  de  100: 


Numero  de  libros 

100 

200 

300 

400 

490 

Tiempo  (en  meses) 

237 

350 

419 

465 

507 

a.  Grafique  el  numero  acumulado  de  libros  como  funcion 
del  tiempo  usando  una  grafica  de  dispersion. 

b.  Describa  la  productividad  del  profesor  Asimov  en 
vista  del  conjunto  de  datos  graficado  en  el  inciso  a). 

I  La  relacion  entre  las  dos  variables  parece  ser  lineal? 

datos  3.22  jQueso,  por  favor!  Es  frecuente  que 
los  estadounidenses  conscientes  de  la  salud 
consulten  la  informacion  nutrimental  de  los  paquetes  de 
alimentos,  en  un  intento  por  evitar  alimentos  con 
grandes  cantidades  de  grasa,  sodio  o  colesterol.  La 
siguiente  informacion  fue  tomada  de  ocho  marcas 
diferentes  de  rebanadas  de  queso  estadounidense: 


Marca 

Grasa 

(g) 

Grasa 

saturada 

(g) 

Coles¬ 

terol 

(mg) 

Sodio 

(mg) 

Calorfas 

Kraft  Deluxe 

American 

7 

4.5 

20 

340 

80 

Kraft  Velveeta 

Slices 

5 

3.5 

15 

300 

70 

Private  Selection 

8 

5.0 

25 

520 

100 

Ralphs  Singles 

4 

2.5 

15 

340 

60 

Kraft  2%  Milk 

Singles 

3 

2.0 

10 

320 

50 

Kraft  Singles 

American 

5 

3.5 

15 

290 

70 

Borden  Singles 

5 

3.0 

15 

260 

60 

Lake  to  Lake 

American 

5 

3.5 

15 

330 

70 

a.  (',Quc  pares  de  variables  espera  usted  que  esten 
fuertemente  relacionados? 

b.  Trace  una  grafica  de  dispersion  para  grasa  y  grasa 
saturada.  Describa  la  relacion. 

c.  Trace  una  grafica  de  dispersion  para  grasa  y  calorfas. 
Compare  el  modelo  con  que  se  encontro  en  el  inciso  b). 

d.  Trace  una  grafica  de  dispersion  para  grasa  contra 
sodio  y  otra  para  colesterol  contra  sodio.  Compare  los 
modelos.  ^Hay  conglomerados  o  resultados  atfpicos? 

e.  Para  los  pares  de  variables  que  parecen  estar 
linealmente  relacionados,  calcule  los  coeficientes  de 
correlation. 


f.  Escriba  un  parrafo  para  resumir  las  relaciones  que 
usted  pueda  ver  en  estos  datos.  Use  las  correlaciones 
y  los  modelos  de  las  cuatro  graficas  de  dispersion  para 
verificar  sus  conclusiones. 

3.23  Ejercito  contra  Infanteria  de  Marina  ^Quienes 
son  los  hombres  y  mujeres  que  prestan  servicio  en 
nuestras  fuerzas  armadas?  (\Son  hombres  o  mujeres, 
oficiales  o  reclutas?  (',Cual  es  su  origen  etnico  y  su  edad 
promedio?  Un  artfculo  en  la  revista  Time  dio  algunos 
conceptos  sobre  la  demograffa  de  las  fuerzas  armadas 
de  Estados  Unidos.9  Dos  de  las  graficas  de  barras  se 
presentan  a  continuation. 


a.  (\Cuales  variables  se  han  medido  en  este  estudio? 

(:,Las  variables  son  cualitativas  o  cuantitativas? 

b.  Describa  la  poblacion  de  interes.  ^ Estos  datos 
representan  una  poblacion  o  una  muestra  sacada  de  la 
poblacion? 

c.  ^Que  tipo  de  presentation  grafica  se  ha  empleado? 
(',Que  otro  tipo  podrfa  haberse  usado? 

d.  ('Como  describirfa  usted  las  similitudes  y  diferencias 
en  las  distribuciones  de  edades  de  personas  reclutadas 
y  oficiales? 


www.FreeLibros.me 


120  O  CAPiTULO  3  DESCRIPCION  DE  DATOS  BIVARIADOS 


e.  /Como  describirfa  usted  las  similitudes  y  diferencias 
en  las  distribuciones  de  edades  del  personal  en  el 
Ejercito  y  en  la  Infanterfa  de  Marina? 

3.24  Queso,  otra  vez!  La  demanda  de  alimentos 
saludables  que  sean  bajos  en  grasas  y  calorfas  ha 
resultado  en  un  gran  numero  de  productos  “bajo  en 
grasas”  y  “sin  grasa”  en  el  supermercado.  La  tabla 
siguiente  muestra  los  numeros  de  calorfas  y  las 
cantidades  de  sodio  (en  miligramos)  por  rebanada  para 
cinco  marcas  diferentes  de  queso  estadounidense  libre  de 
grasa. 


Marca 

Sodio  (mg) 

Calorias 

Kraft  Fat  Free  Singles 

300 

30 

Ralphs  Fat  Free  Singles 

300 

30 

Borden  Fat  Free 

320 

30 

Healthy  Choice  Fat  Free 

290 

30 

Smart  Beat  American 

180 

25 

a.  Trace  una  grafica  de  dispersion  para  describir  la 
relacion  entre  la  cantidad  de  sodio  y  el  numero  de 
calorfas. 

b.  Describa  la  grafica  del  inciso  a).  /Ve  usted  algunos 
resultados  atfpicos?  /El  resto  de  los  puntos  parece 
formar  un  modelo? 

c.  Con  base  solo  en  la  relacion  entre  sodio  y  calorfas, 
/puede  usted  tomar  una  decision  clara  acerca  de  cual 
de  las  cinco  marcas  comprar?  /Es  razonable  basar 
su  election  en  solo  estas  dos  variables?  /Que  otras 
variables  debe  considerar? 

(^)datos  3.25  Corriente  maxima  Conelusodeun 
procedimiento  qufmico  llamado  polarografia 
diferencial  de  pulsos,  un  qufmico  midio  la  corriente 
maxima  generada  (en  microamperes)  cuando  una 
solution  que  contenfa  una  cantidad  determinada  de  nfquel 
(en  partes  por  mil  millones)  se  agrego  a  un  reactivo 
compensador.  Los  datos  se  muestran  a  continuation: 

x=Ni(ppmm)  y=  Corriente  maxima  (/xA) 


19.1 

.095 

38.2 

.174 

57.3 

.256 

76.2 

.348 

95 

.429 

114 

.500 

131 

.580 

150 

.651 

170 

.722 

Use  una  grafica  para  describir  la  relacion  entre  x  y  y. 
Agregue  cualesquiera  medidas  numericas  descriptivas 
que  sean  apropiadas.  Escriba  un  parrafo  que  compen- 
die  sus  resultados. 

datos  3.26  Dinero  del  cine  /Cuanto  dinero  red  ben 
los  cines  en  un  solo  fin  de  semana?  En  alguna 


forma,  /esta  cantidad  predice  el  exito  o  fracaso  de  una 
pelfcula,  o  el  exito  monetario  total  de  la  pelfcula  depende 
mas  del  numero  de  semanas  que  permanezca  en  los  cines? 
En  una  semana  reciente,  los  datos  siguientes  se  recolectaron 
para  las  mejores  10  pelfculas  en  cines  en  esa  semana.10 

Ingreso 

Ingreso  bruto  en  Numero  Promedio  Semanas  bruto  a 

fin  de  semana  de  por  en  lafecha 

Mejores  peliculas  (en  millones)  pantallas  pantalla  exhibicion  (en  millones) 


1  The  Prestige 

Disney 

$14.8 

2281 

$6496 

1 

$14.8 

2  The  Departed 

Warner  Bros. 

$13.7 

3005 

$4550 

3 

$77.1 

3  Flags  of  Our  Fathers 
Paramount/DreamWorks 

$10.2 

1876 

$5437 

1 

$10.2 

4  Open  Season 

Sony 

$8.0 

3379 

$2367 

4 

$69.6 

5  Flicka 

20th  Century  Fox 

$7.7 

2877 

$2676 

1 

$7.7 

5  The  Grudge  2 

Sony 

$7.7 

3124 

$2395 

2 

$31.4 

7  Man  of  the  Year 

Universal 

$7.0 

2522 

$2789 

2 

$22.5 

8  Marie  Antoinette 

Sony 

9  The  Texas  Chainsaw 

$5.3 

859 

$6169 

1 

$5.3 

Massacre:  The  Beginning 
New  Line 

$3.8 

2569 

$1496 

3 

$36.0 

10  The  Marine 

20th  Century  Fox 

$3.7 

2545 

$1463 

2 

$12.5 

a.  /Que  pares  de  variables  de  la  tabla  piensa  usted  que 

tendran  una  correlacion  positiva?  /Cuales  pares  ten¬ 
dran  una  correlacion  negativa?  Explique. 

b.  Trace  una  grafica  de  dispersion  que  relacione  el 
ingreso  bruto  a  la  fecha  con  el  numero  de  semanas  en 
exhibicion.  /  Como  describirfa  usted  la  relacion  entre 
estas  dos  variables? 

c.  Trace  una  grafica  de  dispersion  que  relacione  el 
ingreso  bruto  de  fin  de  semana  con  el  numero  de 
pantallas  en  las  que  la  pelfcula  se  exhibe.  /Como 
describirfa  usted  la  relacion  entre  estas  dos  variables? 

d.  Trace  una  grafica  de  dispersion  que  relacione  el 
promedio  por  pantalla  con  el  numero  de  pantallas 
en  las  que  la  pelfcula  se  exhibe.  /Como  describirfa 
usted  la  relacion  entre  estas  dos  variables? 


3.27  Dinero  del  cine,  continua  Los  datos  del 
ejercicio  3.26  se  introdujeron  en  una  hoja  de  trabajo 
MINITAB ,  obteniendose  la  siguiente  salida. 

Covarianzas: 


Weekend 

gross  Screens 


Avg/  Gross  to 

screen  Weeks  date 


Weekend  gross  14.2 
Screens  403.8 
Avg/screen  4635.5 
Weeks  -0.5 
Gross  to  date  28.3 


521835.8 

-884350.0  3637602.0 

493.2  -1110.9  1.1 

11865.1  -10929.2  23.8 


655.6 


a.  Use  la  salida  MINITAB  o  los  datos  originates  para 
hallar  la  correlacion  entre  el  numero  de  semanas  en 
exhibicion  y  el  ingreso  bruto  a  la  fecha. 
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b.  Para  el  par  de  variables  descritas  en  el  inciso  a), 

^cual  de  las  variables  clasificarfa  usted  como 

la  variable  independiente?  la  variable 
dependiente? 

c.  Use  la  salida  de  MINITAB  o  los  datos  originales  para 
encontrar  la  correlacion  entre  el  ingreso  de  fin  de 
semana  y  el  mimero  de  pantallas  en  las  que  se  esta 
exhibiendo  la  pelicula.  Determine  la  correlacion  entre 
el  numero  de  pantallas  en  las  que  se  esta  exhibiendo  la 
pelicula  y  el  promedio  de  pantallas. 

d.  ^Las  correlaciones  encontradas  en  el  inciso  c) 
confirman  su  respuesta  del  ejercicio  3.26a)?  ^Cuales 
podrian  ser  las  razones  practicas  para  la  direction  y  la 
fuerza  de  las  correlaciones  en  el  inciso  c)? 

3.28  Estaturas  y  genero  Consulte  el  ejercicio  1.54  y 
el  conjunto  de  datos  EX0154.  Cuando  se  registraron  las 
estaturas  de  estos  105  estudiantes,  tambien  se  registro  su 
genero. 

a.  ^Que  variables  se  han  medido  en  este  experimento? 
/.Son  cualitativas  o  cuantitativas? 

b.  Vea  el  histograma  del  ejercicio  1.54  junto  con 
las  graficas  de  caja  comparativas  que  se  muestran 
a  continuation.  ^Las  graficas  de  caja  ayudan  a 
explicar  los  dos  picos  locales  del  histograma? 
Explique. 


Histograma  de  estaturas 


(^)datos  3.29  Desechos  peligrosos  Los  datos  del 
ejercicio  1.37  dieron  el  numero  de  sitios  con 
desechos  peligrosos  en  cada  uno  de  los  50  estados  y 
el  Distrito  de  Columbia  en  2005. 4  Sospechando  que 
pudiera  haber  una  relation  entre  el  numero  de  sitios  con 
desechos  peligrosos  y  el  tamano  del  estado  (en  miles  de 
millas  cuadradas),  unos  investigadores  registraron  ambas 
variables  y  generaron  una  grafica  de  dispersion  con  el 
MINITAB. 


Estado 

Sitios 

Area 

Estado 

Sitios 

Area 

AL 

15 

52 

MT 

15 

147 

AK 

6 

663 

NE 

14 

77 

AZ 

9 

114 

NV 

1 

111 

AR 

10 

53 

NH 

21 

9 

CA 

95 

164 

NJ 

117 

9 

CO 

19 

104 

NM 

13 

122 

CT 

16 

6 

NY 

87 

55 

DE 

15 

2 

NC 

31 

54 

DC 

1 

0 

ND 

0 

71 

FL 

50 

66 

OH 

37 

45 

GA 

17 

59 

OK 

11 

70 

HI 

3 

11 

OR 

11 

98 

ID 

9 

84 

PA 

96 

46 

IL 

48 

58 

Rl 

12 

2 

IN 

30 

36 

SC 

26 

32 

IA 

12 

56 

SD 

2 

77 

KS 

11 

82 

TN 

14 

42 

KY 

14 

40 

TX 

44 

269 

LA 

14 

52 

UT 

18 

85 

ME 

12 

35 

VT 

11 

10 

MD 

18 

12 

VA 

28 

43 

MA 

33 

11 

WA 

47 

71 

Ml 

68 

97 

WV 

9 

24 

MN 

24 

87 

Wl 

38 

65 

MS 

5 

48 

WY 

2 

98 

MINITAB  para  el  ejercicio  3.29 


Covarianzas:  sitios,  area 


60  63  66  69  72  75 


Sites 

Area 


Sites 
682.641 
-98 . 598 


9346 . 603 


*  •  • 

*  •  i 

•  •  *  • 

••  '  /  •« 


0  100 


200  300  400  500  600  700 

Area 


www.FreeLibros.me 


122  O  CAPiTULO  3  DESCRIPCION  DE  DATOS  BIVARIADOS 


a.  7,  Hay  algun  modelo  claro  en  la  grafica  de  dispersion? 
Describa  la  relacion  entre  el  numero  de  sitios  de 
desechos  y  el  tamano  del  estado. 

b.  Use  la  salida  MINITAB  para  calcular  el  coeficiente  de 
correlacion.  ^Esto  confirma  la  respuesta  de  listed  al 
inciso  a)? 

c.  i,Hay  resultados  atipicos  o  conglomerados  en  los 
datos?  Si  es  asf,  ^puede  usted  explicarlos? 

d.  ^Que  otras  variables  podria  usted  considerar  al  tratar 
de  entender  la  distribucion  de  sitios  con  desechos 
peligrosos  en  Estados  Unidos? 

((^ datos  3.30  Brett  Favre,  otra  vez  El  numero 
de  pases  completos  y  el  numero  total  de 
yardas  obtenidas  se  registro  para  Brett  Favre,  en  cada  uno 
de  los  16  juegos  de  temporada  regular  en  el  verano  de 
2006. 11 


Semana 

Pases  completos 

Yardas  totales 

1 

15 

170 

2 

31 

340 

3 

25 

340 

4 

22 

205 

5 

22 

220 

6 

19 

206 

7 

17 

180 

8 

28 

287 

9 

24 

347 

10 

5 

73 

11 

22 

266 

12 

24 

214 

13 

22 

293 

14 

20 

174 

15 

26 

285 

16 

21 

285 

Fuente:  www.espn.com 


a.  Trace  una  grafica  de  dispersion  para  describir  la 
relacion  entre  el  numero  de  pases  completos  y  el  total 
de  yardas  obtenidas  por  Brett  Favre. 

b.  Describa  la  grafica  del  inciso  a).  ■  Observa  algunos 
resultados  atipicos?  ^E1  resto  de  los  puntos  parecen 
formar  un  modelo? 

c.  Calcule  el  coeficiente  de  correlacion,  r,  entre  el 
numero  de  pases  completos  y  el  total  de  yardas 
obtenidas. 

d.  ('Cual  es  la  recta  de  regresion  para  predecir  el  numero 
total  de  yardas  obtenidas  y  basadas  en  el  numero  total 
de  pases  completos  x? 

e.  Si  Brett  Favre  lograra  20  pases  completos  en  su 
siguiente  juego,  ^cual  pronosticaria  usted  que  seria  su 
numero  total  de  yardas  obtenidas? 


3.31  Alfareria,  continua  En  el  ejercicio  1.59, 
analizamos  el  porcentaje  de  oxido  de  aluminio  en  26 
muestras  de  alfareria  romano-britanica  hallada  en  cuatro 
homos  diferentes  en  el  Reino  Unido.12  Como  uno  de  los 
sitios  solo  dio  dos  mediciones,  ese  sitio  esta  eliminado  y 
a  continuacion  vemos  graficas  de  caja  comparativas  de 
oxido  de  aluminio  en  los  otros  tres  sitios. 


a.  ^Cuales  dos  variables  se  han  medido  en  este 
experimento?  <\Son  cualitativas  o  cuantitativas? 

b.  ('Como  compararia  usted  la  cantidad  de  oxido  de 
aluminio  de  las  muestras  en  los  tres  sitios? 

(^)datos  3.32  Alfareria,  continua  A  continuacion 
veamos  el  porcentaje  de  oxido  de  aluminio,  el 
porcentaje  de  oxido  de  hierro  y  el  porcentaje  de  oxido 
de  magnesio  en  cinco  muestras  recolectadas  en  Ashley 
Rails,  en  el  Reino  Unido. 


Muestra 

Al 

Fe 

Mg 

1 

17.7 

1.12 

0.56 

2 

18.3 

1.14 

0.67 

3 

16.7 

0.92 

0.53 

4 

14.8 

2.74 

0.67 

5 

19.1 

1.64 

0.60 

a.  Encuentre  los  coeficientes  de  correlacion  que 
describan  las  relaciones  entre  el  contenido  de  oxido  de 
hierro  y  el  de  magnesio,  y  entre  el  oxido  de  aluminio  y 
el  de  magnesio. 

b.  Escriba  una  oracion  que  describa  las  relaciones  entre 
estos  tres  productos  quimicos  y  las  muestras  de 
alfareria. 

(^)datos  3.33  Redes  de  computadoras  en  casa 

La  tabla  siguiente  (ejercicio  1.50)  presenta 
el  aumento  pronosticado  de  redes  de  computadoras  de 
hogar  en  los  siguientes  anos.13 
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Redes  de  hogar  en  EE.  UU.  (en  millones) 


Ano 

Conectada 

Inalambrica 

2002 

6.1 

1.7 

2003 

6.5 

4.5 

2004 

6.2 

8.7 

2005 

5.7 

13.7 

2006 

4.9 

19.1 

2007 

4.1 

24.0 

2008 

3.4 

28.2 

Fuente:  Jupiter  Research 

a.  (iQue  variables  se  han  medido  en  este  experimento? 
('.Son  cualitativas  o  cuantitativas? 

b.  Use  uno  de  los  metodos  graficos  dados  en  este 
capitulo  para  describir  los  datos. 

c.  Escriba  una  oracion  describiendo  la  relacion  entre 
tecnologfa  por  cable  e  inalambrica,  como  sera  en  los 
siguientes  anos. 

3.34  Politica  y  religion  Se  realizo  una  encuesta  antes 
de  la  eleccion  presidencial  de  2004,  para  explorar  la 
relacion  entre  el  fervor  religioso  de  una  persona  y  su 
eleccion  de  un  candidato  politico.  A  los  votantes  se  les 
pregunto  la  frecuencia  con  la  que  asistian  a  la  iglesia, 
asi  como  a  cual  de  los  dos  candidatos  presidenciales 
principales  (George  W.  Bush  o  su  oponente  democrata) 
favorecerian  en  la  eleccion  de  2004. 14  Los  resultados 
aparecen  a  continuacion. 


Asistencia  a  la  iglesia 

G.W.  Bush 

Candidato  democrata 

Mas  de  una  vez  a  la  semana 

63% 

37% 

Una  vez  a  la  semana 

56% 

44% 

Una  o  dos  veces  al  mes 

52% 

48% 

Una  o  dos  veces  al ano 

46% 

54% 

Rara  vez/nunca 

38% 

62% 

Fuente:  Press-Enterprise 

a.  ^Que  variables  han  sido  medidas  en  esta  encuesta? 
^Son  cualitativas  o  cuantitativas? 

b.  Trace  graficas  comparativas  de  barras  lado  a  lado  para 
describir  los  porcentajes  a  favor  de  los  dos  candidatos, 
clasificados  por  asistencia  a  la  iglesia. 

c.  Trace  dos  graficas  de  lineas  en  el  mismo  conjunto  de 
ejes  para  describir  los  mismos  porcentajes  para  los  dos 
candidatos. 

d.  (,Que  conclusiones  se  pueden  sacar  usando  las 
dos  graficas  de  los  incisos  b)  y  c)?  ^Cual  es  mas 
efectiva? 

(^)datos  3.35  Distancia  entre  puntas  de  brazos 
extendidos  y  estatura  Leonardo  da  Vinci 
(1452-1519)  trazo  el  bosquejo  de  un  hombre,  indicando 
que  la  distancia  entre  las  puntas  de  sus  brazos 
(medida  por  la  espalda,  con  los  brazos  extendidos  para 


formar  una  “T”)  es  aproximadamente  igual  a  la  estatura 
de  la  persona.  Para  demostrar  esta  expresion  midio  ocho 
personas,  con  los  siguientes  resultados: 

Persona  12  3  4 

Distancia  (pulgadas)  68  62.25  65  69.5 

Estatura  (pulgadas)  69  62  65  70 

Persona  5  6  7  8 

Distancia  (pulgadas)  68  69  62  60.25 

Estatura  (pulgadas)  67  67  63  62 


a.  Trace  una  grafica  de  dispersion  para  distancia  entre 
brazos  extendidos  y  estatura.  Use  la  misma  escala 
en  los  ejes  horizontal  y  vertical.  Describa  la 
relacion  entre  las  dos  variables. 

b.  Calcule  el  coeficiente  de  correlacion  que  relacione  la 
distancia  entre  brazos  y  estatura. 

c.  Si  usted  fuera  a  calcular  la  recta  de  regresion  para 
predecir  la  estatura  con  base  en  la  distancia  entre  los 
brazos  extendidos  de  una  persona,  ^como  estimarfa  la 
pendiente  de  esta  recta? 

d.  Encuentre  la  recta  de  regresion  que  relacione  la 
distancia  entre  brazos  extendidos  y  la  estatura  de 
la  persona. 

e.  Si  una  persona  tiene  una  distancia  de  62  pulgadas 
entre  sus  brazos  extendidos,  ^cual  pronosticana  usted 
que  es  la  estatura  de  la  persona? 

(^Jdatos  3.36  Ingresos  de  una  linea  aerea  El 

numero  de  pasajeros  x  (en  millones)  y  el  ingreso 
y  (en  miles  de  millones  de  dolares),  para  las  nueve 
principales  aerolineas  de  Estados  Unidos  en  un  ano 
reciente,  se  dan  en  la  tabla  siguiente.4 
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American 

United 

Delta  Northwest 

Continental 

X 

98.0 

66.7 

86.0 

56.5 

42.8 

y 

20.7 

17.4 

16.2 

12.3 

11.2 

U.S.Air 

Southwest 

Alaska 

Sky  We  st 

X 

64.0 

88.4 

16.7 

16.6 

y 

5.1 

7.6 

3.0 

2.0 

Fuente:  The  World  Almanac  and  Book  of  Facts  2007 

a.  Construya  una  grafica  de  dispersion  para  los  datos. 

b.  Describa  la  forma,  direccion  y  fuerza  del  modelo  de  la 
grafica  de  dispersion. 

(^)datos  3.37  Entrevistas  de  examen  De  dos 

tecnicas  que  hay  para  la  evaluacion  de  personal, 
la  primera  requiere  una  entrevista-examen  de  dos  horas 
y  la  segunda  se  puede  completar  en  menos  de  una  hora. 
Las  puntuaciones  para  cada  una  de  las  ocho  personas  que 
tomaron  ambos  examenes  se  dan  en  la  tabla  siguiente. 

Solicitante  Examen  1  (x)  Examen  ( y ) 


1 

75 

38 

2 

89 

56 

3 

60 

35 

4 

71 

45 

5 

92 

59 

6 

105 

70 

7 

55 

31 

8 

87 

52 

a.  Construya  una  grafica  de  dispersion  para  los  datos. 

b.  Describa  la  forma,  direccion  y  fuerza  del  modelo  de  la 
grafica  de  dispersion. 

3.38  Entrevistas  de  examen,  continua  Consulte  el 
ejercicio  3.37. 

a.  Encuentre  el  coeficiente  de  correlacion,  r,  para 
describir  la  relacion  entre  los  dos  examenes. 


b.  ^Estarla  usted  dispuesto  a  usar  el  segundo  y  mas 
rapido  examen  que  la  mas  larga  entrevista-examen 
para  evaluar  personal?  Explique. 

datos  3.39  Lluvia  y  nieve  ^Hay  una  correlacion 

entre  la  cantidad  de  lluvia  y  la  cantidad  de  nieve 
que  cae  en  un  lugar  en  particular?  La  tabla  siguiente 
muestra  el  promedio  anual  de  lluvia  (en  pulgadas)  y 
el  promedio  anual  de  nevadas  (en  pulgadas)  para  10 
ciudades  de  Estados  Unidos.15 


Ciudad 

Lluvia  (en  pulgadas) 

Nieve  (en  pulgadas) 

Billings,  MT 

14.77 

56.9 

Casper,  WY 

13.03 

77.8 

Concord,  NH 

37.60 

64.5 

Fargo,  ND 

21.19 

40.8 

Kansas  City,  M0 

37.98 

19.9 

Juneau,  AK 

58.33 

97.0 

Memphis,  TN 

54.65 

5.1 

New  York,  NY 

49.69 

28.6 

Portland,  OR 

37.07 

6.5 

Springfield,  IL 

35.56 

23.2 

Fuente:  Time  Almanac  2007 


a.  Construya  una  grafica  de  dispersion  para  los  datos. 

b.  Calcule  el  coeficiente  de  correlacion  r  entre  lluvia  y 
nevadas.  Describa  la  forma,  direccion  y  fuerza  de  la 
relacion  entre  lluvia  y  nevada. 

c.  (',Hay  algunos  resultados  atlpicos  en  la  grafica  de 
dispersion?  Si  es  asl,  ('C|ue  ciudad  representa  este 
resultado  atlpico? 

d.  Elimine  el  resultado  atlpico  que  encontro  en  el 
inciso  c)  del  conjunto  de  datos  y  vuelva  a  calcular  el 
coeficiente  de  correlacion  r  para  las  nueve  ciudades 
restantes.  ^Gambia  la  correlacion  entre  lluvia  y  nieve? 
Si  es  asl,  ('  en  que  forma? 


APPLET 


3.40  Si  todavla  no  lo  hace,  use  el  primer  applet  en 
Building  a  Scatterplot  (Construyendo  una  grafica  de 
dispersion)  para  crear  una  grafica  de  dispersion  para  los 
datos  del  ejemplo  3.4. 

3.41  Si  todavla  no  lo  hace,  use  el  segundo  applet  en 
Building  a  Scatterplot  (Construyendo  una  grafica  de 
dispersion)  para  crear  una  grafica  de  dispersion  para  los 
datos  del  ejemplo  3.5. 

(^)datos  3.42  Telefonos  inalambricos  La  tabla 

siguiente  muestra  los  precios  de  ocho  telefonos 


inalambricos  sencillos,  junto  con  su  calificacion  general 
(en  una  escala  de  0-100)  en  un  estudio  de  clasificacion  de 
consumidores  presentado  por  Consumer  Reports. 16 

Marcay  modelo  Precio  Calificacion  general 


Uniden  EXI  4246 

$25 

77 

AT&T  E2116 

30 

74 

Panasonic  KX-TG5621S 

50 

74 

GE  27831 GE1 

20 

73 

VTech  V  Mix 

30 

72 

VTech  ia5829 

30 

71 

Panasonic  KX-TG2421W 

40 

70 

Clarity  C410 

70 

65 
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a.  Calcule  el  coeficiente  de  correlacion  r  entre  precio 
y  calificacion  general.  ^Como  describiria  usted  la 
relacion  entre  precio  y  calificacion  general? 

b.  Use  el  applet  llamado  Correlation  and  the 
Scatterplot  (Correlacion  y  la  grafica  de  dispersion) 
para  graficar  los  ocho  puntos  de  datos.  <Cual  es  el 
coeficiente  de  correlacion  mostrado  en  el  applet? 
Compare  con  el  valor  que  calculo  en  el  inciso  a). 

c.  Describa  el  modelo  que  ve  usted  en  la  grafica  de 
dispersion.  <^Que  inesperada  relacion  ve  en  los  datos? 

datos  3.43  Calificaciones  de  semestre  Cuando 
un  estudiante  realiza  en  mala  forma  un  examen 
semestral,  a  veces  se  convence  que  su  calificacion  es 
una  anomalfa  y  que  las  calificaciones  van  a  mejorar  en 
el  segundo  semestre.  Los  datos  siguientes  muestran  las 
calificaciones  de  semestre  (de  100  puntos)  para  ocho 
estudiantes  en  un  grupo  de  introduction  a  la  estadfstica. 

Estudiante  Semestre  1  Semestre  2 


1 

70 

88 

2 

58 

52 

3 

85 

84 

4 

82 

74 

5 

70 

80 

6 

40 

36 

7 

85 

48 

8 

85 

96 

a.  Calcule  el  coeficiente  de  correlacion  r  entre  las 
calificaciones  semestrales.  ^Como  describiria  la 
relacion  entre  calificaciones  del  primero  y  segundo 
semestres? 

b.  Use  el  applet  llamado  Correlation  and  the 
Scatterplot  (Correlacion  y  la  grafica  de 
dispersion)  para  graficar  los  ocho  puntos  de  datos. 
^Cual  es  el  coeficiente  de  correlacion  que  se  muestra 
en  el  applet?  Compare  con  el  valor  que  calculo  en  el 
inciso  a). 

c.  Describa  el  modelo  que  ve  usted  en  la  grafica  de 
dispersion.  7,  Hay  conglomerados  o  resultados  atfpicos? 
Si  es  asf,  tc6mo  los  explicarfa? 


3.44  Entre  al  applet  llamado  Exploring  Correlation 
(Explorando  la  correlacion). 


a.  Mueva  el  cursor  del  primer  applet  para  que  r  ~  .75. 
Ahora  cambie  el  signo  usando  el  boton  HllUsItillfl  de 
la  parte  inferior  del  applet.  Describa  el  cambio  en  el 
modelo  de  los  puntos. 


b.  Mueva  el  cursor  del  primer  applet  para  que  r  ~  0. 
Describa  el  modelo  de  puntos  en  la  grafica  de 
dispersion. 

c.  Consulte  el  inciso  b).  En  el  segundo  applet  marcado 
Correlation  and  the  Quadrants  (Correlacion  y  los 
cuadrantes),  con  r  ~  0,  cuente  el  numero  de  puntos 
que  caen  en  cada  uno  de  los  cuatro  cuadrantes  de  la 
grafica  de  dispersion.  7,  La  distribucion  de  los  puntos 
en  los  cuadrantes  es  relativamente  uniforme  o  mas  de 
los  puntos  caen  en  ciertos  cuadrantes  que  en  otros? 

d.  Use  el  segundo  applet  marcado  Correlation  and 
the  Quadrants  (Correlacion  y  los  cuadrantes)  y 
cambie  el  coeficiente  de  correlacion  ar~  —0.9. 

(',La  distribucion  de  puntos  en  los  cuadrantes  es 
relativamente  uniforme,  o  mas  puntos  caen  en  ciertos 
cuadrantes  que  en  otros?  (iQue  ocurre  si  r  ~  0.9? 

e.  Use  el  tercer  applet  marcado  Correlation  and 
the  Regression  Line  (Correlacion  y  la  recta  de 
regresion).  Mueva  el  cursor  para  ver  la  relacion  entre 
el  coeficiente  de  correlacion  r,  la  pendiente  de  la  recta 
de  regresion  y  la  direction  de  la  relacion  entre  x  y  y. 
Describa  la  relacion. 

3.45  Suponga  que  la  relacion  entre  dos  variables  x  y 
y  puede  ser  descrita  por  la  recta  de  regresion  y  =  2.0 
+  0.5x.  Use  el  applet  en  How  a  Line  Works  (Como 
trabaja  una  recta)  para  contestar  las  siguientes 
preguntas: 

a.  ^Cual  es  el  cambio  en  y  para  el  cambio  de  una  unidad 
en  x? 

b.  ^Los  cambios  de  y  aumentan  o  disminuyen  cuando  x 
aumenta? 

c.  (',En  que  punto  la  recta  cruzara  el  eje  y?  ^Cual  es  el 
nombre  dado  a  este  valor? 

d.  Si  x  =  2.5,  use  la  ecuacion  de  imnimos  cuadrados  para 
predecir  el  valor  de  y.  ^Que  valor  pronosticarfa  usted 
paray  six  =  4.0? 

3.46  Entre  al  applet  en  How  a  Line  Works  (Como 
trabaja  una  recta). 

a.  Use  el  cursor  para  cambiar  la  intersection  y  de  la 
recta,  pero  no  cambie  la  pendiente.  Describa  los 
cambios  que  vea  en  la  recta. 

b.  Use  el  cursor  para  cambiar  la  pendiente  de  la  recta, 
pero  no  cambie  la  intersection  y.  Describa  los 
cambios  que  vea  en  la  recta. 
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CASO 

prActico 


tPiensa  us  ted  que  sus  platos  estan 
realmente  limpios? 


(:,EI  precio  de  un  aparato  electrodomestico  da  a  entender  algo  acerca  de  su  calidad? 
Treinta  y  seis  lavadoras  de  loza  diferentes  se  clasificaron  en  caracterfsticas  que  van  de 
una  calificacidn  general  de  satisfaccion,  lavado  (xi),  uso  de  energfa  (x2),  ruido  (x3),  flexi- 
bilidad  de  carga  (x4),  facilidad  de  uso  (x5)  y  tiempo  de  ciclo  (en  minutos).17  La  Kenmore 
(1374[2])  tuvo  la  mas  alta  calificacion  de  rendimiento  de  83,  mientras  que  la  Whirlpool 
Gold  GU3600XTS[Q]  tuvo  la  mas  baja  en  76.  Los  pictogramas  de  calificaciones  se  con- 
virtieron  a  valores  numericos  para  xu  x5  con  5  =  Excelente,  4  =  Muy  buena,  3  = 
Buena,  2  =  Regular  y  1  =  Mala.  Utilice  un  paquete  de  estadfstica  por  computadora  para 
explorar  las  relaciones  entre  diversos  pares  de  variables  de  la  tabla. 


Excelente  Muy  buena  Buena  Regular  Mala 

o  ©  • 


Marca  y  modelo 

Precio 

Calificacion 

x,  x2  x3 

x4 

*5 

Tiempo  de  ciclo 

x, 

x2 

*3 

x4 

*5 

Ariston  LI670 

$800 

48. 

©  O 

o 

o 

190 

4 

2 

3 

3 

3 

Asko  D3122XL 

$850 

78. 

o©o 

o 

o 

115 

5 

4 

3 

3 

3 

Asko  Encore  D3531XLHD[SS] 

$1600 

81. 

ooo 

145 

5 

5 

5 

4 

4 

Bosch  SHE45C0[2]UC 

$700 

78. 

0  0  9 

o 

o 

125 

5 

4 

4 

3 

3 

Bosch  SHE58C0[2]UC 

$900 

78. 

O  0  0 

© 

135 

5 

4 

4 

4 

4 

Frigidaire  GLD2445RF[S] 

$400 

62. 

o©o 

o 

o 

105 

3 

4 

3 

3 

5 

Frigidaire  Gallery  GLD4355RF[S] 

$500 

71. 

©©o 

o 

o 

110 

4 

4 

3 

3 

5 

Frigidaire  Professional  PLD4555RF[C] 

$710 

75. 

©©o 

© 

o 

120 

4 

4 

3 

4 

5 

GE  GLD4600N[WW] 

$460 

75. 

©©o 

o 

o 

115 

4 

4 

3 

3 

5 

GE  GLD5900N[WW] 

$510 

74. 

©©« 

o 

o 

115 

4 

4 

4 

3 

5 

GE  GLD6700N[WW] 

$550 

68. 

©©© 

o 

115 

4 

4 

4 

4 

5 

GE  Monogram  ZBD0710N[SS] 

$1500 

59. 

o©o 

© 

o 

115 

3 

4 

3 

4 

5 

GE  Profile  PDW8600N[WW] 

$900 

68. 

©©© 

o 

o 

115 

4 

4 

4 

3 

5 

GE  Profile  PDW9900N[WW] 

$1300 

70. 

©©© 

o 

120 

4 

4 

4 

4 

5 

Haier  ESD310 

$600 

56. 

oo 

© 

o 

125 

4 

3 

3 

4 

5 

Kenmore  (Sears)  1359(2] 

$350 

68. 

®o© 

o 

o 

110 

5 

3 

2 

3 

5 

Kenmore  (Sears)  1373(2] 

$580 

79. 

o©o 

o 

125 

5 

4 

3 

4 

5 

Kenmore  (Sears)  1374(2] 

$650 

83. 

o©© 

© 

o 

125 

5 

4 

4 

4 

5 

Kenmore  (Sears)  Elite  1376(2] 

$800 

79. 

o©© 

6 

0 

130 

5 

4 

4 

5 

4 

Kenmore  (Sears)  Elite  1378(2] 

$1000 

82. 

o©© 

o 

© 

125 

5 

4 

4 

5 

4 

Kenmore  (Sears)  PRO  1387(3] 

$1400 

78. 

O  0  0 

o 

© 

130 

5 

4 

4 

5 

4 

KitchenAid  Architect  KUDD01  DP[WH] 

$1400 

60. 

©©© 

© 

© 

115 

4 

4 

2 

4 

4 

KitchenAid  KUDK03CT[WH] 

$650 

76. 

o©© 

o 

© 

130 

5 

4 

4 

3 

4 

KitchenAid  KUDS03CT[WH] 

$850 

78. 

o©© 

o 

© 

115 

5 

4 

4 

5 

4 

KitchenAid  KUDU03ST[SS] 

$1400 

79. 

o©© 

o 

© 

125 

5 

4 

4 

5 

4 

LG  LDF7810[WW] 

$800 

77. 

©o© 

0 

o 

110 

4 

5 

4 

5 

5 

LG  LDS581 1  [W] 

$650 

74. 

o 

o 

140 

4 

4 

5 

5 

5 

Maytag  MDB4651AW[W] 

$400 

71. 

oo 

o 

© 

110 

4 

3 

3 

3 

4 

Maytag  MDB5601AW[W] 

$450 

68. 

o 

© 

120 

5 

3 

4 

4 

4 

Maytag  MDB6601AW[W] 

$500 

71. 

oo 

© 

© 

120 

5 

3 

3 

4 

4 

Maytag  MDB7601AW[W] 

$560 

71. 

© 

o 

6 

130 

5 

2 

4 

5 

5 

Maytag  MDB8751BW[W] 

$700 

74. 

©oo 

o 

o 

120 

5 

3 

3 

5 

5 

Miele  Advanta  G2020SC 

$1000 

74. 

o 

© 

o 

125 

5 

4 

3 

4 

3 

Whirlpool  DU1100XTP[Q] 

$500 

77. 

o©o 

© 

o 

125 

5 

4 

3 

4 

5 

Whirlpool  Gold  GU2455XTS[Q] 

$550 

77. 

o©o 

o 

o 

125 

5 

4 

3 

3 

5 

Whirlpool  Gold  GU3600XTS[Q] 

$750 

76. 

o©o 

o 

© 

130 

5 

4 

3 

5 

4 

Fuente:  ©  2007  por  Consumers  Union  of  U.S.,  Inc.,  Yonkers,  NY  10703-1057,  organization  sin  fines  de  lucro.  Reimpreso  con  permiso 
de  la  edicion  de  septiembre  de  2007  de  Consumer  Reports®  solo  para  fines  educativos.  No  se  permite  el  uso  comercial  ni  reproduction. 
www.ConsumerReports.org® 


1.  Vea  individualmente  las  variables  de  Precio,  Calificacion  y  Tiempo  de  ciclo.  ^Que 
puede  usted  decir  acerca  de  la  simetrfa?  de  resultados  atfpicos? 

2.  Vea  todas  las  variables  en  pares.  (jQue  pares  estan  correlacionados  en  forma  positiva? 
(',Y  en  forma  negativa?  H ay  pares  que  exhiban  poca  o  ninguna  correlacion?  ^Algunos 
de  estos  resultados  son  contrarios  a  lo  que  uno  pudiera  esperar  de  manera  intuitiva? 

3 .  El  precio  de  un  aparato  electrodomestico,  especfficamente  una  lavadora  de  loza,  da  a  enten¬ 
der  algo  acerca  de  su  calidad?  (,Quc  variables  utilizo  usted  para  llegar  a  su  respuesta? 
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Probabilidad 
y  distribuciones 
de  probabilidad 


OBJETIVOS  GENERALES _ 

Ahora  que  ya  ha  aprendido  usted  a  describir  un  conjunto 
de  datos,  icomo  puede  usar  datos  muestrales  para  sacar 
conclusiones  acerca  de  las  poblaciones  muestreadas?  En 
esta  tecnica  interviene  una  herramienta  estadistica  llamada 
probabilidad y,  para  usarla  correctamente,  usted  debe  pri- 
mero  entender  como  funciona.  La  primera  parte  de  este 
capltulo  le  ensenara  el  nuevo  lenguaje  de  la  probabilidad, 
presentando  los  conceptos  basicos  con  ejemplos  sencillos. 

Las  variables  que  medimos  en  los  capitulos  1  y  2  se 
pueden  definir  ahora  como  variables  aleatorias,  con  valores 
que  dependen  de  la  seleccion  de  la  probabilidad  de  los  ele- 
mentos  de  la  muestra.  Usando  la  probabilidad  como  herra¬ 
mienta,  se  pueden  crear  distribuciones  de  probabilidad  que 
sirven  como  modelos  para  variables  aleatorias  discretas  y 
usted  puede  describir  estas  variables  aleatorias  usando  una 
media  y  desviacion  estandar  semejantes  a  las  del  capltulo  2. 


IN  DICE  DEL  CAPITULO 

Las  reglas  de  la  adicion  y  la  multiplicacion  (4.6) 

Regia  de  Bayes  y  la  Ley  de  Probabilidad  Total  (opcio- 
nal)  (4.7) 

Probabilidad  condicional  e  independencia  (4.6) 

Reglas  de  conteo  (opcional)  (4.4) 

Experimentos  y  eventos  (4.2) 

Intersecciones,  uniones  y  complementos  (4.5) 

La  media  y  desviacion  estandar  para  una  variable  alea- 
toria  discreta  (4.8) 

Distribuciones  de  probabilidad  para  variables  aleatorias 
discretas  (4.8) 


Variables  aleatorias  (4.8) 

Definicion  de  probabilidad  de  frecuencia  relativa  (4.3) 


ENTRENADOR  PERSONAL 


£Cual  es  la  diferencia  entre  eventos  mutuamente 
exclusivos  e  independientes? 


©  Imagen  obtenida  de  la  pagina  http://en.wikipedia.org/wiki/Michael_Crichton.  Uso  validado  con- 
forme  a  las  disposiciones  de  Creative  Commons  <http://en.wikipedia.org/wiki/Wikipedia: 
Text_of_Creative_Commons_Attribution-ShareAlike_3.0_Unported_License> . 


Probabilidad  y  tom  a  de 
decisiones  en  el  Congo 

En  su  sensacional  novela  Congo,  el  autor  Michael 
Crichton  describe  una  expedicion  que  corre  para 
hallar  diamantes  azules  cubiertos  de  boro  en  los 
bosques  lluviosos  de  la  region  oriental  de  Zaire. 
yLa  probabilidad  puede  ayudar  a  la  heroina  Ka¬ 
ren  Ross  en  su  busqueda  de  la  Ciudad  Perdida  de 
Zinj?  El  estudio  practico  del  final  de  este  capltulo 
involucra  el  uso  de  la  probabilidad  de  Ross  en 
situaciones  de  toma  de  decisiones. 
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EL  PAPEL  DE  LA  PROBABILIDAD 
EN  ESTADISTICA 

La  probabilidad  y  la  estadistica  estan  relacionadas  en  una  forma  importante.  La  proba- 
bilidad  se  emplea  como  herramienta\  permite  que  usted  e  value  la  confiabilidad  de  sus 
conclusiones  acerca  de  la  poblacion  cuando  tenga  solo  informacion  muestral.  Considere 
estas  situaciones: 


•  Cuando  lance  al  aire  una  sola  moneda,  vera  cara  (H)  o  cruz  (T).  Si  lanza  la  mo- 
neda  varias  veces  al  aire,  va  a  generar  un  numero  infinitamente  grande  de  caras 
o  cruces,  es  decir,  toda  la  poblacion.  <^Que  aspecto  tiene  esta  poblacion?  Si  la 
moneda  es  imparcial,  entonces  la  poblacion  debe  contener  50%  de  H  y  50% 

de  T.  Ahora  lance  al  aire  la  moneda  una  vez  mas.  ^Cual  es  la  probabilidad  de  que 
resulte  una  cara?  Casi  todos  dirfan  que  la  “probabilidad”  es  1/2. 

•  Ahora  suponga  que  no  esta  usted  seguro  de  que  la  moneda  sea  imparcial,  esto  es, 
no  sabe  con  certeza  si  la  composicion  de  la  poblacion  es  50-50  y  decide  hacer  un 
experimento  sencillo.  Lanza  al  aire  la  moneda  n  =  10  veces  y  observa  10  caras 
consecutivas.  (iPucde  concluir  que  la  moneda  es  imparcial?  Es  probable  que  no, 
porque  si  asf  fuera,  observar  10  caras  en  fila  serfa  muy  improbable,  esto  es,  la 
“probabilidad”  serfa  muy  pequena.  Es  mas  probable  que  la  moneda  este  “car- 
gada”. 


Al  igual  que  en  el  ejemplo  de  lanzar  al  aire  una  moneda,  los  expertos  en  estadistica  usan 
la  probabilidad  en  dos  formas.  Cuando  la  poblacion  es  conocida,  se  usa  la  probabilidad 
para  describir  la  probabilidad  de  observar  un  resultado  muestral  en  particular.  Cuando  la 
poblacion  es  desconocida  y  solo  se  dispone  de  una  muestra  de  esa  poblacion,  la  probabili¬ 
dad  se  usa  para  hacer  enunciados  acerca  de  la  composicion  de  la  poblacion,  es  decir,  hacer 
inferencias  estadisticas. 

En  los  capitulos  4-7  usted  vera  numerosas  formas  diferentes  para  calcular  probabili- 
dades.  Supondra  que  la  poblacion  es  conocida  y  calculara  la  probabilidad  de  observar 
varios  resultados  muestrales.  Una  vez  que  empiece  a  usar  la  probabilidad  para  inferencia 
estadistica  en  el  capitulo  8,  la  poblacion  sera  desconocida  y  usted  usara  su  conocimiento 
de  probabilidad  para  hacer  inferencias  confiables  a  partir  de  informacion  muestral. 
Empecemos  con  algunos  ejemplos  sencillos  para  ayudarle  a  captar  conceptos  basicos 
de  probabilidad. 


EVENTOS  Y  EL  ESPACIO  MUESTRAL 

Se  obtienen  datos  al  observar  ya  sea  eventos  no  controlados  en  la  naturaleza  o  situa¬ 
ciones  controladas  en  un  laboratorio.  Usamos  el  termino  experimento  para  describir 
cualquiera  de  los  dos  metodos  de  recoleccion  de  datos. 


Definicion  Un  experimento  es  el  proceso  mediante  el  cual  se  obtiene  una  observa- 
cion  (o  medicion). 


La  observacion  o  medicion  generada  por  un  experimento  puede  o  no  producir  un 
valor  numerico.  A  continuation  veamos  algunos  ejemplos  de  experiment  os: 

•  Registrar  la  calificacion  de  un  examen 

•  Medir  la  cantidad  de  lluvia  diaria 

•  Entrevistar  a  un  dueno  de  casa  para  obtener  su  opinion  sobre  un  reglamento  para 
distribuir  por  zonas  un  area  verde 
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•  Probar  una  tarjeta  de  circuito  impreso  para  determinar  si  es  un  producto  defec- 
tuoso  o  aceptable. 

•  Lanzar  al  aire  una  moneda  y  observar  el  lado  que  aparece. 

Cuando  se  realiza  un  experimento,  lo  que  observamos  es  un  resultado  llamado  evento 
simple,  con  frecuencia  denotado  por  la  mayuscula  E  con  un  sublndice. 


Definicion  Un  evento  simple  es  el  resultado  que  se  observa  en  una  sola  repeticion 
del  experimento. 


Experimento:  Lance  un  dado  y  observe  el  ntiiuero  que  aparece  en  la  cara  superior.  Haga 
una  lista  de  los  eventos  sencillos  del  experimento. 

Solucion  Cuando  el  dado  se  lanza  una  vez,  hay  seis  posibles  resultados.  Hay  los 
eventos  sencillos  citados  a  continuation: 

Evento  E,:  observar  un  1  Evento  £4:  observar  un  4 

Evento  E-r.  observar  un  2  Evento  £5:  observar  un  5 

Evento  E3:  observar  un  3  Evento  Eb :  observar  un  6 


Ahora  podemos  definir  un  evento  como  un  conjunto  de  eventos  sencillos,  a  menudo 
denotado  por  una  letra  mayuscula. 


Definicion  Un  evento  es  un  conjunto  de  eventos  sencillos. 


Podemos  definir  los  eventos  Ay  B  para  el  experimento  de  lanzar  al  aire  un  dado: 

A:  observar  un  nil  mem  impar 
B:  observar  un  ntiiuero  menor  a  4 

Como  el  evento  A  se  presenta  si  la  cara  superior  es  1,  3  o  5,  es  un  conjunto  de  tres  even¬ 
tos  sencillos  y  escribimos  A  =  {£,,  E3,  E5}.  Del  mismo  modo,  el  evento  B  ocurre  si  la 
cara  superior  es  1,  2  o  3  y  esta  definido  como  una  serie  o  conjunto  de  estos  tres  eventos 
sencillos:  B  =  {Eu  E2,E3}. 


A  veces,  cuando  ocurre  un  evento,  significa  que  no  puede  ocurrir  otro. 


Definicion  Dos  eventos  son  mutuamente  excluyentes  si,  cuando  ocurre  un  evento, 
los  otros  no  pueden  ocurrir  y  viceversa. 


En  el  experimento  de  lanzar  al  aire  un  dado,  los  eventos  Ay  B  no  son  mutuamente 
excluyentes,  porque  tienen  dos  resultados  en  conuin,  si  el  mimero  de  la  cara  superior  del 
dado  es  1  o  3.  Ambos  eventos,  Ay  B,  ocurriran  si  se  observa  Ex  o  E3  cuando  se  realiza 
el  experimento.  En  contraste,  los  seis  eventos  simples  Eu  E2, . . . ,  E6  forman  un  conjunto 
de  todos  los  resultados  mutuamente  excluyentes  del  experimento.  Cuando  el  experi¬ 
mento  se  realiza  una  vez,  puede  ocurrir  uno  y  solo  uno  de  estos  eventos  sencillos. 


Definicion  El  conjunto  de  todos  los  eventos  sencillos  se  denomina  espacio  mues- 
tral,  S. 
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A  veces  es  util  visualizar  un  experimento  usando  una  imagen  llamada  diagrams  de 
Venn,  que  se  ilustra  en  la  figura  4.1.  La  caja  exterior  representa  el  espacio  muestral, 
que  contiene  todos  los  eventos  sencillos,  representados  por  puntos  marcados.  Como 
un  evento  es  un  conjunto  de  uno  o  mas  eventos  sencillos,  los  puntos  apropiados  estan 
circulados  y  marcados  con  la  letra  del  evento.  Para  el  experimento  de  lanzar  al  aire  un 
dado,  el  espacio  muestral  es  S  =  { Eh  E2,  E3,  E4,  E5,  E6}  o  bien,  de  un  modo  mas  simple, 
S  =  { 1,  2,  3,  4,  5,  6}.  Los  eventos  A  =  { 1,  3,  5}  y  B  =  { 1,  2,  3}  estan  circulados  en  el 
diagrama  de  Venn. 


FIGURA  4.1 

Diagrama  de  Venn  para 
tiro  de  un  dado 


Experimento:  Lance  al  aire  una  sola  moneda  y  observe  el  resultado.  Estos  son  los  even¬ 
tos  sencillos: 

£,:  observar  una  cara  (H) 

E2\  observar  una  cruz  (T) 

El  espacio  muestral  es  S  =  {Eu  E2],  o  bien,  die  ho  en  forma  mas  sencilla,  S  =  {H,  T}. 


Experimento:  Registre  el  tipo  de  sangre  de  una  persona.  Los  cuatro  posibles  resultados 
mutuamente  exclusivos  son  estos  eventos  sencillos: 


Ei  =  sangre  tipo  A 
Ei  =  sangre  tipo  B 
Ei  =  sangre  tipo  AB 
E4  =  sangre  tipo  O 

El  espacio  muestral  es  S  =  {Eu  E2,  E3,  E4),  o  S  =  {A,  B,  AB,  0}. 


Algunos  experimentos  se  pueden  general-  en  etapas  y  el  espacio  muestral  se  puede 
mostrar  en  un  diagrama  de  arbol.  Cada  nivel  de  ramification  sucesivo  del  arbol  corres- 
ponde  a  un  paso  requerido  para  general-  el  resultado  final. 

Un  tecnico  medico  registra  el  tipo  sangumeo  y  factor  Rh  de  una  persona.  Haga  una  lista 
de  los  eventos  sencillos  del  experimento. 

Solucion  Por  cada  persona,  se  hace  necesario  un  procedimiento  de  dos  etapas  para 
registrar  las  dos  variables  de  interes.  El  diagrama  de  arbol  se  muestra  en  la  figura  4.2. 
Los  ocho  eventos  sencillos  del  diagrama  de  arbol  forman  el  espacio  muestral,  S  =  { A+, 
A—,  B  +  ,  B— ,  AB  +  ,  AB  — ,  0  +  ,  0-}. 
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Una  forma  alternativa  para  exhibit-  los  eventos  sencillos  es  usar  una  tabla  de  proba- 
bilidad,  como  se  muestra  en  la  tabla  4.1.  Los  renglones  y  columnas  muestran  los  posi- 
bles  resultados  en  las  etapas  primera  y  segunda,  respectivamente  y  los  eventos  sencillos 
se  muestran  en  las  celdas  de  la  tabla. 


FIGURA  4.2 

Diagrama  de  arbol  para  el 
ejemplo  4.4 


Tipo  sangumeo  Factor  Rh  Resultado 


+ 


E{  :  A+ 
e2  ■  A- 
'•  B+ 

e4-.b- 

Es  :  AB+ 
E6  :  AB- 

E2  o+ 

Es:0- 


TABLA  4  I  Tabla  de  probabilidad  para  el  ejemplo  4.4 


Tipo  sanguineo 

Factor  Rh 

A 

B 

AB 

0 

Negativo 

A- 

B- 

AB- 

0- 

Positivo 

A+ 

B+ 

AB+ 

0+ 

cAlculo  de  probabilidades  con 

EL  USO  DE  EVENTOS  SENCILLOS 

La  probabilidad  de  un  evento  A  es  una  medida  de  nuestra  creencia  de  que  el  evento  A 
ocurrira.  Una  manera  practica  de  interpretar  esta  medida  es  con  el  concepto  d e  frecuen¬ 
cia  relativa.  Recuerde  del  capitulo  1  que  si  un  experimento  se  realiza  n  veces,  entonces 
la  frecuencia  relativa  de  un  suceso  particular,  por  ejemplo  A,  es 


Frecuencia  relativa  = 


Frecuencia 

n 


donde  la  frecuencia  es  el  numero  de  veces  que  ocurrio  el  evento  A.  Si  hacemos  que  el 
numero  n  de  repeticiones  del  experimento  se  haga  cada  vez  mas  grande  (n  — »  °°),  en 
ultima  instancia  se  genera  toda  la  poblacion.  En  esta,  la  frecuencia  relativa  del  evento  A 
se  define  como  la  probabilidad  del  evento  A;  esto  es, 


P(A)  =  lim 

n— »oo 


Frecuencia 

n 


Como  P(A)  se  comporta  como  una  frecuencia  relativa,  P(A)  debe  ser  una  propor- 
cion  que  se  encuentre  entre  0  y  1;  P(/\)  =  0  si  el  evento  A  nunca  ocurre,  y  P(A )  =  1  si 
el  evento  A  siempre  ocurre.  Cuanto  mas  cercano  sea  P{A)  a  1,  es  mas  probable  que  A 
ocurra. 
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Por  ejemplo,  si  se  lanza  al  aire  un  dado  balanceado  de  seis  caras  un  numero  de  veces 
infinito,  se  esperaria  que  la  frecuencia  relativa  para  cualesquiera  de  los  seis  valores, 
x  =  1, 2,  3, 4,  5,  6,  fuera  1/6.  Sobra  decir  que  serfa  muy  lento,  si  no  imposible,  repetir  un 
experimento  un  numero  infinito  de  veces.  Por  esta  razon,  hay  metodos  alternativos  para 
calcular  probabilidades  que  hacen  uso  del  concepto  de  frecuencia  relativa. 

Una  consecuencia  importante  de  la  definicion  de  frecuencia  relativa  de  una  probabi- 
lidad  involucra  a  eventos  sencillos.  Como  los  eventos  sencillos  son  mutuamente  exclu- 
yentes,  sus  probabilidades  deben  satisfacer  dos  condiciones. 


REQUISITOS  PARA  PROBABILIDADES 
DE  UN  EVENTO  SIMPLE 

•  Cada  probabilidad  debe  estar  entre  0  y  1. 

•  La  suma  de  las  probabilidades  de  todos  los  eventos  sencillos  en  5  igual  a  1. 

Cuando  es  posible  escribir  los  eventos  sencillos  asociados  con  un  experimento  y  deter- 
minar  sus  probabilidades  respectivas,  podemos  hallar  la  probabilidad  de  un  evento  A  si 
sumamos  las  probabilidades  de  todos  los  eventos  sencillos  contenidos  en  el  evento  A. 


EJEMPLO 


Definicion  La  probabilidad  de  un  evento  A  es  igual  a  la  suma  de  las  probabilida¬ 
des  de  los  eventos  sencillos  contenidos  en  A. 


Lance  al  aire  dos  monedas  imparciales  y  registre  el  resultado.  Encuentre  la  probabilidad 
de  observar  exactamente  una  cara  en  los  dos  tiros. 


CONSEJO 


Las  probabilidades  deben 
estar  entre  0  y  1. 


Solucion  Para  poner  en  una  lista  los  eventos  sencillos  en  el  espacio  muestral,  se  puede 
usar  un  diagrama  de  arbol  como  se  muestra  en  la  figura  4.3.  Las  letras  H  y  T  significan 
que  usted  observo  una  cara  o  una  cruz,  respectivamente,  en  un  tiro  en  particular.  Para 
asignar  probabilidades  a  cada  uno  de  los  cuatro  eventos  sencillos,  hay  que  recordar  que 
las  monedas  son  imparciales.  Por  tanto,  cualquiera  de  los  cuatro  eventos  sencillos  es  tan 
probable  como  cualquier  otro.  Como  la  suma  de  los  cuatro  eventos  sencillos  debe  ser  1, 
cada  uno  debe  tener  una  probabilidad  P(E,)  =  1/4.  Los  eventos  sencillos  del  espacio 
muestral  se  muestran  en  la  tabla  4.2,  junto  con  sus  probabilidades  igualmente  posibles. 
Para  hallar  P(A)  =  Pfobservar  exactamente  una  cara),  es  necesario  hallar  todos  los  even¬ 
tos  sencillos  que  resulten  en  el  evento  A,  es  decir  E2  y  E3: 


P(A)  =  P(E2)  +  P(EA 


i  +  i 

4  +  4 


1 

2 


FIGURA  4.3 

Diagrama  de  arbol  para  el 
ejemplo  4.5 


CONSEJO 


Las  probabilidades  de  todos 
los  eventos  sencillos  deben 
totalizar  1. 


Primera  moneda  Segunda  moneda  Resultado 
Cara  (H) 

El  =  (HH) 


E2  =  (HT) 
£3  =  (TH) 

E,  =  (TT) 
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TABLA  4.2  Eventos  sencillos  y  sus  probabilidades 


Evento 

Primera  moneda 

Segunda  moneda 

P(£J 

£, 

H 

H 

1/4 

e2 

H 

T 

1/4 

Ei 

T 

H 

1/4 

Et 

T 

T 

1/4 

Las  proporciones  de  fenotipos  sangumeos  A,  B,  AB  y  O  en  la  poblacion  de  todos  los  de 
raza  caucasica  en  Estados  Unidos  se  publican  como  .41, .  10,  .04  y  .45,  respectivamente.1 
Si  al  azar  se  escoge  una  persona  de  este  origen  etnico  en  la  poblacion,  ^cual  es  la  proba- 
bilidad  de  que  el  o  ella  tengan  tipo  de  sangre  A  o  tipo  AB? 

Solucion  Los  cuatro  eventos  sencillos,  A,  B,  AB  y  O  no  tienen  probabilidades  igual- 
mente  posibles.  Sus  probabilidades  se  encuentran  usando  el  concepto  de  frecuencia  rela- 
tiva  como 

P(A)  =  .41  P(B)  =  .10  P(AB)  =  .04  P(O)  =  .45 


El  evento  de  interes  esta  formado  por  dos  eventos  sencillos,  de  modo  que 

Pil'd  persona  es  tipo  A  o  tipo  AB)  =  P( A)  +  /YAB) 

=  .41  +  .04  =  .45 


EJEMPLO 


Un  plato  contiene  un  dulce  amarillo  y  dos  rojos.  Usted  cierra  los  ojos,  del  plato  escoge 
dos  dulces,  uno  por  uno  y  anota  sus  colores.  Cual  es  la  probabilidad  de  que  ambos 
dulces  sean  rojos? 


Solucion  Como  no  se  dan  probabilidades,  se  debe  hacer  una  lista  de  los  eventos  sen¬ 
cillos  del  espacio  muestral.  La  seleccion  de  los  dulces  en  dos  etapas  sugiere  un  diagrama 
de  arbol,  que  se  muestra  en  la  figura  4.4.  Hay  dos  dulces  rojos  en  el  plato,  de  modo  que 
se  pueden  usar  las  letras  Rb  R2  y  Y  para  indicar  que  se  ha  seleccionado  el  primero  rojo, 
el  segundo  rojo  o  el  dulce  amarillo,  respectivamente.  Como  usted  cerro  los  ojos  cuando 
escogio  los  dulces,  las  seis  opciones  deben  ser  igualmente  probables  y  se  les  asigna  la 
probabilidad  1/6.  Si  A  es  el  evento  de  que  ambos  dulces  sean  rojos,  entonces 


A  {R,R2,  R2R,} 


Entonces, 


P(A)  =  E(R,R2)  +  E(R2Ri) 


I  +  I 
6  6 


FIGURA  4.4 

Diagrama  de  arbol  para  el 
ejemplo  4.7 


CONSEJO 


Un  diagrama  de  arbol  ayuda  a 
hallar  eventos  sencillos. 


Rama  =  paso  hacia  el 
resultado. 


Ramas  siguientes  =>  lista  de 
eventos  sencillos. 


Primera  seleccion  Segunda  seleccion 


Evento  simple 

Probabilidad 

R1R2 

1/6 

Ri  Y 

1/6 

R2Rl 

1/6 

r2y 

1/6 

YR1 

1/6 

yr2 

1/6 
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CALCULO  DE  LA  PROBABILIDAD  DE  UN  EVENTO 

1.  Haga  una  lista  de  todos  los  eventos  sencillos  del  espacio  muestral. 

2.  Asigne  una  probabilidad  apropiada  a  cada  evento  simple. 

3.  Determine  cuales  eventos  sencillos  resultan  en  el  evento  de  interes. 

4.  Sume  las  probabilidades  de  los  eventos  sencillos  que  resulten  en  el  evento  de 
interes. 

En  su  calculo,  usted  siempre  debe  tener  cuidado  de  satisfacer  estas  dos  condiciones: 

•  Incluir  todos  los  eventos  sencillos  en  el  mismo  espacio. 

•  Asignar  probabilidades  realistas  a  los  eventos  sencillos. 

Cuando  el  espacio  muestral  es  grande,  es  facil  de  omitir  sin  intencion  algunos  de  los 
eventos  sencillos.  Si  esto  ocurre,  o  si  sus  probabilidades  asignadas  son  erroneas,  sus 
respuestas  no  seran  utiles  en  la  practica. 

Una  forma  de  determinar  el  niimero  requerido  de  eventos  sencillos  es  usar  las  reglas 
de  conteo  presentadas  en  la  siguiente  seccion  opcional.  Estas  reglas  se  pueden  usar  para 
resolver  problemas  mas  complejos,  que  generalmente  comprenden  un  gran  numero  de 
eventos  sencillos.  Si  necesita  dominar  solo  los  conceptos  basicos  de  probabilidad,  pue- 
de  escoger  saltarse  a  la  siguiente  seccion. 


EJERCICIOS 


TECNICAS  BASICAS 

4.1  Tiro  de  un  dado  Un  experimento  consiste  en  tirar 
un  solo  dado.  Estos  son  algunos  eventos: 

A:  observar  un  2 


4.2  Un  espacio  muestral  S  esta  formado  por  cinco 
eventos  sencillos  con  estas  probabilidades: 

P(Ei)  =  P(E2)  =  .15  P(E3)  =  .4 

Pm  =  2  P(ES) 


B:  observar  un  niimero  par 
C:  observar  un  niimero  mayor  a  2 
D\  observar  Ay  B 
E:  observar  A  o  B  o  ambos 
F:  observar  Ay  C 

a.  Haga  una  lista  de  eventos  sencillos  del  espacio 
muestral. 

b.  Haga  una  lista  de  eventos  sencillos  en  cada  uno  de  los 
eventos  A  al  F. 

c.  ^Que  probabilidades  debe  asignar  a  los  eventos 
sencillos? 

d.  Calcule  las  probabilidades  de  los  seis  eventos  A  al 
F  sumando  las  probabilidades  apropiadas  de  evento 
simple. 


a.  Encuentre  las  probabilidades  para  los  eventos  sencillos 

e. 4  y  e5. 

b.  Encuentre  las  probabilidades  para  estos  dos  eventos: 

A  =  {Ei,  Ei,  Ea) 

B  =  {E2,E3} 

c.  Haga  una  lista  de  eventos  sencillos  que  se  encuentren 
en  el  evento  A  o  en  el  evento  B  o  en  ambos. 

d.  Haga  una  lista  de  eventos  sencillos  que  se  encuentre 
en  el  evento  A  y  en  el  B. 

4.3  Un  espacio  muestral  contiene  10  eventos  sencillos: 
Ei,  E2, . .  . ,  E10.  Si  P(Ei)  =  3P(E2 )  =  .45  y  los  restantes 
eventos  sencillos  son  igualmente  probables,  encuentre  las 
probabilidades  de  estos  restantes  eventos. 
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4.4  Tiros  libres  Una  jugadora  de  baloncesto  acierta  en 
70%  de  sus  tiros  libres.  Cuando  ella  lanza  un  par  de  tiros 
libres,  los  cuatro  eventos  sencillos  posibles  y  tres  de  sus 
probabilidades  asociadas  se  dan  en  la  tabla: 


Evento 

simple 

Resultado 
del  primer 
tiro  libre 

Resultado 
del  segundo 
tiro  libre 

Probabilidad 

1 

Encesta 

Encesta 

.49 

2 

Encesta 

Falla 

? 

3 

Falla 

Encesta 

.21 

4 

Falla 

Falla 

.09 

a.  Encuentre  la  probabilidad  de  que  la  jugadora  enceste 
en  el  primer  tiro  y  falle  en  el  segundo. 

b.  Encuentre  la  probabilidad  de  que  la  jugadora  enceste 
en  al  menos  uno  de  los  dos  tiros  libres. 

4.5  Cuatro  monedas  Un  frasco  contiene  cuatro 
monedas:  una  de  cinco,  una  de  10,  una  de  25  y  una  de 
50  centavos.  Se  seleccionan  al  azar  tres  monedas  del 
frasco. 

a.  Haga  una  lista  de  los  eventos  simples  en  S. 

b.  /Cual  es  la  probabilidad  de  que  la  selection  contenga 
la  moneda  de  50  centavos? 

c.  /Cual  es  la  probabilidad  de  que  la  suma  total  sacada 
sea  igual  a  60  centavos  o  mas? 

4.6  /Preescolar  o  no?  El  primer  dia  de  clase  de  jardfn 
de  ninos,  el  maestro  selecciona  al  azar  uno  de  sus  25 
estudiantes  y  registra  el  genero  del  estudiante,  asf  como  si 
habia  tenido  preescolar. 

a.  /Como  describirfa  usted  el  experimento? 

b.  Construya  un  diagrama  de  arbol  para  este 
experimento.  /Cuantos  eventos  simples  hay  ahi? 

c.  La  tabla  siguiente  muestra  la  distribution  de  los 
25  estudiantes  de  acuerdo  a  genero  y  experiencia 
preescolar.  Use  la  tabla  para  asignar  probabilidades 
a  los  eventos  simples  del  inciso  b). 

Hombre  Mujer 

Preescolar  8  9 

Sin  preescolar  6  2 

d.  /Cual  es  la  probabilidad  de  que  el  estudiante 
seleccionado  al  azar  sea  hombre?  /Cual  es  la 
probabilidad  de  que  el  estudiante  sea  mujer  y  no 
haya  tenido  preescolar? 

4.7  El  problema  de  la  urna  Un  tazon  contiene  tres 
pelotas  rojas  y  dos  amarillas.  Dos  de  ellas  se  seleccionan 
al  azar  y  se  registran  sus  colores.  Use  un  diagrama  de 
arbol  para  hacer  una  lista  de  los  20  eventos  simples  del 
experimento,  teniendo  en  mente  el  orden  en  el  que  se 
sacan  las  pelotas. 


4.8  El  problema  de  la  urna,  continua  Consulte  el 
ejercicio  4.7.  Una  pelota  se  selecciona  al  azar  del  tazon 
que  contiene  tres  pelotas  rojas  y  dos  amarillas.  Se  toma 
nota  de  su  color,  y  la  pelota  se  devuelve  al  tazon  antes 
de  seleccionar  una  segunda  pelota.  Haga  una  lista  de 
los  otros  cinco  eventos  simples  que  deben  agregarse  al 
espacio  muestral  del  ejercicio  4.7. 

APLICACIONES 

4.9  /Necesita  lentes?  Un  estudio  clasifico  a  un 
gran  numero  de  adultos  de  acuerdo  a  si  se  considera 
que  necesitan  lentes  para  corregir  su  vista  para  leer  y  si 
usan  lentes  cuando  leen.  Las  proporciones  que  caen  en 
las  cuatro  categorfas  se  muestran  en  la  tabla  siguiente. 
(Observe  que  una  pequena  proporcion,  .02,  de  adultos 
usaba  lentes  cuando  de  hecho  se  considera  que  no  los 
necesitan.) 

Usaba  lentes 
para  leer 

Se  considera  que 

necesitan  lentes  Si  No 

Si  .44  .14 

No  .02  .40 

Si  un  solo  adulto  se  selecciona  de  este  grupo  grande, 
encuentre  la  probabilidad  de  cada  evento: 

a.  Se  considera  que  el  adulto  necesita  lentes. 

b.  El  adulto  necesita  lentes  para  leer  pero  no  los  usa. 

c.  El  adulto  usa  lentes  para  leer,  los  necesite  o  no. 

4. 1 0  Ruleta  El  juego  de  ruleta  usa  una  rueda  que 
contiene  38  buchacas.  Treinta  y  seis  buchacas  numeradas 
1,  2, .  .  . ,  36  y  las  dos  restantes  estan  marcadas  0  y  00.  La 
rueda  se  hace  girar  y  una  buchaca  es  identificada  como 

la  “ganadora”.  Suponga  que  la  observancia  de  cualquier 
buchaca  es  igualmente  probable  que  cualquier  otra. 

a.  Identifique  los  eventos  simples  en  un  solo  giro  de  la 
rueda  de  la  ruleta. 

b.  Asigne  probabilidades  a  los  eventos  simples. 

c.  Sea  A  el  evento  que  usted  observa  ya  sea  0  o  00. 

Haga  una  lista  de  los  eventos  simples  del  evento  A  y 
encuentre  P(A). 

d.  Suponga  que  usted  aposto  en  los  numeros  del  1  al  18. 
/Cual  es  la  probabilidad  de  que  uno  de  sus  numeros 
sea  el  ganador? 

4.11  Miembros  de  un  jurado  Tres  personas  son 
seleccionadas  al  azar  de  un  registro  de  votantes  y  de 
personas  con  licencia  de  manejo,  para  reportarse  como 
miembros  de  un  jurado.  El  concejal  del  condado  toma 
nota  del  genero  de  cada  persona. 
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a.  Defina  el  experimento. 

b.  Haga  una  lista  de  los  eventos  simples  en  S. 

c.  Si  es  igualmente  probable  que  cada  persona  sea 
hombre  o  mujer, t|ue  probabilidad  le  asigna  usted  a 
cada  evento  simple? 

d.  ,'Cual  es  la  probabilidad  de  que  solo  una  de  las  tres 
sea  mujer? 

e.  /Cual  es  la  probabilidad  de  que  las  tres  sean  mujeres? 

4.12  Miembros  de  un  jurado  II  Consulte  el 
ejercicio  4.1 1.  Suponga  que  hay  seis  prospectos  para 
miembros  de  jurado,  cuatro  hombres  y  dos  mujeres,  que 
podrian  ser  elegidos  para  ocupar  un  asiento  en  el  jurado 
en  un  caso  criminal.  Dos  jurados  se  seleccionan  al  azar 
de  estos  seis  para  ocupar  los  dos  asientos  restantes  del 
jurado. 

a.  Haga  una  lista  de  los  eventos  simples  del 
experimento.  (sugerencia:  Hay  15  eventos  simples  si 
se  ignora  el  orden  de  selection  de  los  dos  jurados.) 

b.  ('Cual  es  la  probabilidad  de  que  ambos  jurados 
elegidos  sean  mujeres? 

4.13  Probadores  de  te  Una  compania  de  alimentos 
planea  efectuar  un  experimento  para  comparar  su  marca 
de  te  con  la  de  dos  competidores.  Una  sola  persona 

es  contratada  para  probar  y  clasificar  cada  una  de  las  tres 
marcas  de  te,  que  no  tienen  marca  excepto  por  simbolos 
de  identificacion  A,  B  y  C. 

a.  Defina  el  experimento. 

b.  Haga  una  lista  de  eventos  simples  en  S. 

c.  Si  el  probador  no  tiene  capacidad  para  distinguir 
una  diferencia  en  gusto  entre  los  tes,  ^cual 

es  la  probabilidad  de  que  el  probador  clasifique 
el  te  tipo  A  como  el  mas  deseable?  (Como  el  menos 
deseable? 

4.14  Carrera  de  100  metros  Cuatro  corredores 
igualmente  calificados,  John,  Bill,  Ed  y  Dave,  corren  un 
sprint  de  100  metros  y  se  registra  el  orden  de  llegadas. 

a.  ('  Cuantos  eventos  simples  hay  en  el  espacio  muestral? 

b.  Si  los  corredores  estan  igualmente  calificados,  (',quc 
probabilidad  debe  usted  asignar  a  cada  evento  simple? 

c.  ,'Cual  es  la  probabilidad  de  que  Dave  gane  la  carrera? 

d.  ,'Cual  es  la  probabilidad  de  que  Dave  gane  y  John  se 
coloque  en  segundo  lugar? 

e.  ('  Cual  es  la  probabilidad  de  que  Ed  termine  en  ultimo 
lugar? 


4.15  Vloscas  de  la  fruta  En  un  experimento  de 
genetica,  el  investigador  apareo  dos  moscas  de  la  fruta 
Drosophila  y  observo  los  rasgos  de  100  descendientes. 
Los  resultados  se  muestran  en  la  tabla. 

Tamano  de  alas 

Color  deojos  Normal  Miniatura 

Normal  140  6 

Bermellon  3  151 

Uno  de  estos  descendientes  se  selecciona  al  azar  y  se  le 
observan  los  dos  rasgos  geneticos. 

a.  (\CuaI  es  la  probabilidad  de  que  la  mosca  tenga  color 
normal  de  ojos  y  tamano  normal  de  alas? 

b.  (iCual  es  la  probabilidad  de  que  la  mosca  tenga  ojos 
bermellon? 

c.  <,Cual  es  la  probabilidad  de  que  la  mosca  tenga  ojos 
bermellon  o  alas  miniatura,  o  ambos? 

4.16  Creacion  ^Para  usted,  que  de  lo  siguiente  es 
mas  cercano  al  origen  y  desarrollo  de  los  seres  humanos? 
(.Piensa  que  los  seres  humanos  se  han  desarrollado 
durante  millones  de  anos  a  partir  de  formas  menos 
avanzadas  de  vida,  pero  que  Dios  ha  guiado  el  proceso? 
(■.Piensa  que  los  seres  humanos  se  han  desarrollado 
durante  millones  de  anos  a  partir  de  formas  menos 
avanzadas  de  vida,  y  que  Dios  no  ha  tornado  parte  en 

el  proceso?  piensa  usted  que  Dios  creo  a  los  seres 
humanos  en  su  forma  actual  hace  no  mas  de  10  mil  anos 
o  algo  asi?  Cuando  se  les  hicieron  estas  preguntas,  las 
proporciones  de  estadounidenses  con  diversas  opiniones 
son  aproximadamente  como  se  muestra  en  la  tabla.2 


Opinion  Proporcion 


Guiados  por  Dios  .36 

Dios  no  tomo  parte  .13 

Dios  creo  en  la  forma  presente  .46 

No  tiene  opinion  .05 


Fuente:  Adaptado  de  www.pollingreport.com 

Suponga  que  al  azar  se  selecciona  una  persona  y  que  se 

registra  su  opinion  sobre  esta  pregunta. 

a.  ((Cuales  son  los  eventos  simples  del  experimento? 

b.  Los  eventos  simples  del  inciso  a)  (;son  igualmen¬ 
te  probables?  Si  no  es  asf,  ^cuales  son  las 
probabilidades? 

c.  (',Ciial  es  la  probabilidad  de  que  la  persona  sienta 
que  Dios  tuvo  algo  de  parte  en  la  creacion  de  seres 
humanos? 

d.  (  Cual  es  la  probabilidad  de  que  la  persona  sienta  que 
Dios  no  tuvo  parte  en  el  proceso? 
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REGLAS  UTILES  DE  CQNTEO  (OPCIONAL) 

Suponga  que  un  experimento  comprende  un  gran  numero  N  de  eventos  simples  y  que 
usted  sabe  que  todos  esos  eventos  son  igualmente  probables.  Entonces  cada  evento 
simple  tiene  una  probabilidad  I  IN  y  la  probabilidad  de  un  evento  A  se  puede  calcular 
como 


rm  =  $ 

donde  nA  es  el  numero  de  eventos  simples  que  resultan  en  el  evento  A.  En  esta  seccion, 
presentamos  tres  reglas  sencillas  que  se  pueden  usar  para  contar  ya  sea  N.  el  numero  de 
eventos  simples  del  espacio  muestral,  o  nA,  el  numero  de  eventos  simples  del  evento  A. 
Una  vez  que  haya  obtenido  estas  cuentas,  puede  hallar  P(A)  sin  en  realidad  hacer  una 
lista  de  todos  los  eventos  simples. 


LA  REGLA  mn 

Considere  un  experimento  que  se  realiza  en  dos  etapas.  Si  la  primera  etapa  se  pue¬ 
de  efectuar  en  m  formas  y,  para  cada  una  de  estas,  la  segunda  etapa  se  puede  lograr  en 
n  formas,  entonces  hay  mn  formas  para  efectuar  el  experimento. 

Por  ejemplo,  supongamos  que  usted  puede  ordenar  un  auto  en  uno  de  tres  estilos  y 
en  uno  de  cuatro  colores  de  pintura.  Para  averiguar  cuantas  opciones  hay  disponibles, 
puede  considerar  primero  escoger  uno  de  los  m  =  3  estilos  y  luego  seleccionar  uno  de 
los  n  =  4  colores  de  pintura.  Con  el  uso  de  la  Regia  mn,  como  se  muestra  en  la  figura 
4.5,  tiene  mn  =  (3)(4)  =  12  posibles  opciones. 


FIGURA  4.5 

Combinaciones  de  estilo 
y  color 


Estilo  Color 


Se  tiran  dos  dados.  Cuantos  eventos  simples  hay  en  el  espacio  muestral  5? 

Solucio  El  primer  dado  puede  caer  en  una  de  m  =  6  formas,  y  el  segundo  en  una 
de  n  =  6  formas.  Como  el  experimento  comprende  dos  etapas,  que  forma  los  pares  de 
numeros  que  se  muestran  en  las  dos  caras,  el  numero  total  de  eventos  simples  en  5  es 

mn  =  (6)(6)  =  36 
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El  applet  Java  llamado  Tossing  Dice  (Tirar  dados)  da  una  imagen  visual  de  los  36 
eventos  simples  descritos  en  el  ejemplo  4.8.  Usted  puede  usar  este  applet  para  hallar 
probabilidades  para  cualquier  evento  que  comprenda  el  tiro  de  dos  dados  imparciales. 
A1  dar  un  clic  en  las  combinaciones  de  dados  apropiadas,  hemos  encontrado  la  pro- 
babilidad  de  observar  una  suma  de  3  en  las  caras  superiores  como  2/36  =  .056.  <:Cual 
es  la  probabilidad  de  que  la  suma  sea  igual  a  4?  Usara  este  applet  para  los  ejercicios 
Mi  Applet  del  final  del  capftulo. 


FIGURA  4.6 

Applet  de  Tirar  dados 


Probability  2/36  =  0.056 
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Un  plato  de  dulces  contiene  un  dulce  amarillo  y  dos  rojos.  Del  plato  se  seleccionan  dos 
dulces,  uno  por  uno,  registrando  sus  colores.  ^Cuantos  eventos  simples  hay  en  el  espacio 
muestral  SI 


El  primer  dulce  se  puede  escoger  en  m  =  3  formas.  Como  un  dulce  ya 
no  esta  ahora,  el  segundo  dulce  se  puede  escoger  en  n  =  2  formas.  El  nuiuero  total  de 
eventos  simples  es 

mn  =  (3)(2)  =  6 

Estos  seis  eventos  simples  aparecen  en  el  ejemplo  4.7. 


Podemos  extender  la  Regia  mn  para  un  experimento  que  se  realiza  en  mas  de  dos 
etapas. 


LA  REGLA  mn  EXTENDIDA 

Si  un  experimento  se  realiza  en  k  etapas,  con  n  formas  para  efectuar  la  primera  etapa, 
n2  formas  para  efectuar  la  segunda  etapa,  .  .  .  ,  y  nt  formas  para  efectuar  la  /c-esima 
etapa,  entonces  el  numero  de  formas  para  efectuar  el  experimento  es 


nin2n3  ■  ■  •  nk 
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^Cuantos  eventos  simples  hay  en  el  espacio  muestral  cuando  se  lanzan  al  aire  tres  mo- 
nedas? 

Solucion  Cada  moneda  puede  caer  en  una  de  dos  formas.  Por  tanto,  el  numero  de 
eventos  simples  es 

(2)(2)(2)  =  8 


El  chofer  de  un  camion  puede  tomar  tres  rutas  de  la  ciudad  A  a  la  ciudad  B,  cuatro  de  la 

ciudad  B  a  la  C  y  tres  de  la  ciudad  C  a  la  D.  Si,  cuando  viaja  de  A  a  D,  el  chofer  debe  ir 

de  A  a  B  a  C  a  D,  ^cuantas  rutas  posibles  de  A  a  D  hay? 

Solucion  Sean 

rii  =  numero  de  rutas  de  A  a  B  =  3 
n2  =  numero  de  rutas  de  B  a  C  =  4 
n3  =  numero  de  rutas  de  C  a  D  =  3 

Entonces,  el  numero  total  de  formas  para  construir  una  ruta  completa,  tomando  una 
secundaria  desde  cada  uno  de  los  tres  grupos,  (A  a  B),  {B  a  C)  y  (C  a  D),  es 

nin2n3  =  (3)(4)(3)  =  36 


Una  segunda  y  util  regia  de  conteo  se  sigue  de  la  Regia  mn  y  comprende  ordena- 
mientos  o  permutaciones.  Por  ejemplo,  supongamos  que  usted  tiene  tres  libros,  A,  B 
y  C,  pero  tiene  espacio  solo  para  dos  en  su  estante.  ^En  cuantas  formas  puede  usted 
seleccionar  y  acomodar  los  dos  libros?  Hay  tres  opciones  para  los  dos  libros,  Ay  B,  Ay 
C,  o  B  y  C,  pero  cada  uno  de  los  pares  se  puede  acomodar  en  dos  formas  en  el  estante. 
Todas  las  permutaciones  de  los  dos  libros,  escogidas  de  tres,  aparecen  en  la  tabla  4.3. 
Entonces  la  Regia  mn  implica  que  hay  seis  formas,  porque  el  primer  libro  se  puede 
escoger  en  m  =  3  formas  y  el  segundo  en  n  =  3  formas,  de  modo  que  el  resultado  es 
mn  =  6. 


Permutaciones  de  dos  libros  escogidos  de  tres 

Combinaciones  de  dos  Reordenamiento  o  combinaciones 


AB  BA 

AC  CA 

BC  CB 


('En  cuantas  formas  puede  usted  acomodar  los  tres  libros  en  su  estante?  Hay  las  seis 
permutaciones: 

ABC  ACB  BAC 
BCA  CAB  CBA 

Como  el  primer  libro  se  puede  escoger  en  nx  =  3  formas,  el  segundo  en  n2  =  formas,  y  el 
tercero  en  n3  =  1  forma,  el  numero  total  de  ordenamientos  es  n , n2n3  =  (3)(2)(1)  =  6. 

En  lugar  de  aplicar  la  Regia  mn  cada  vez,  usted  puede  hallar  el  numero  de  ordena¬ 
mientos  usando  una  formula  general  que  involucra  una  notation  factorial. 
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E  J  E  M  P  L 


E  J  E  M  P  L 


UNA  REGLA  DE  CONTEO  PARA  PERMUTACIONES 

El  niimero  de  formas  en  que  podemos  acomodar  n  objetos  distintos,  tomandolos  una 
canddad  r  a  la  vez,  es 

p"  —  —!—■ _ 

'  “  (n  -  r)! 

donde  n\  =  n{n  —  1)(«  —  2)  •  •  •  (3)(2)(1)  y  0!  =  1. 


Como  se  seleccionan  r  objetos,  este  es  un  experimento  de  r-etapas.  El  primer  objeto  se 
puede  escoger  en  n  formas,  el  segundo  en  (n  —  1)  formas,  el  tercero  en  (n  —  2)  formas  y 
el  /--esimo  en  (n  —  r  +  1)  formas.  Podemos  simplificar  esta  engorrosa  notation  usando 
la  regia  de  conteo  para  permutaciones  porque 

n\  _  n(n  —  1  )(n  —  2)  •  •  •  (n  —  r  +  1  )(n  —  /)•■•  (2)(1) 

(n  -  r)!  (n  -  r)  ■  ■  •  (2)(1) 

=  n(n  —  !)•••(«  —  r+1) 


UN  CASO  ESPECIAL:  ORDENAR  n  OBJETOS 

El  numero  de  formas  para  ordenar  todo  un  conjunto  de  n  objetos  distintos  es  P'„  =  n\ 


Tres  billetes  de  loterfa  se  sacan  de  entre  un  total  de  50.  Si  los  billetes  se  han  de  distribuir 
a  cada  uno  de  tres  empleados  en  el  orden  en  que  son  sacados,  el  orden  sera  importante. 
^Cuantos  eventos  simples  estan  asociados  con  el  experimento? 

Solucion  El  numero  total  de  eventos  simples  es 

p5°  =  M  =  50(49)(48)  =  117600 


Una  maquina  esta  compuesta  de  cinco  partes  que  se  pueden  ensamblar  en  cualquier 
orden.  Se  ha  de  realizar  una  prueba  para  determinar  el  tiempo  necesario  para  cada  orden 
de  ensamble.  Si  cada  orden  se  ha  de  probar  una  vez,  ^cuantas  pruebas  deben  efec- 
tuarse? 


Solucion  El  numero  total  de  pruebas  es 
Pi  =  §  =  5(4)(3)(2)(1)  =  120 


Cuando  contamos  el  numero  de  permutaciones  de  los  dos  libros  escogidos  para  su 
estante,  empleamos  un  metodo  sistematico: 

•  Primero  contamos  el  numero  de  combinaciones  o  pares  de  libros  a  escoger. 

•  A  continuation  contamos  el  numero  de  formas  para  ordenar  los  dos  libros  esco¬ 
gidos  en  el  estante. 

A  veces  el  orden  o  acomodo  de  los  objetos  no  es  importante,  sino  solo  los  objetos  que 
se  escogen.  En  este  caso,  se  puede  usar  una  regia  de  conteo  para  combinaciones.  Por 
ejemplo,  puede  que  no  nos  importe  el  orden  en  que  los  libros  se  coloquen  en  el  estante, 
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sino  solo  cuales  libros  podemos  poner  en  el  estante.  Cuando  una  comision  de  cinco  per¬ 
sonas  se  selecciona  de  entre  un  grupo  de  12  estudiantes,  el  orden  de  la  seleccion  no  es 
importante  porque  los  cinco  estudiantes  seran  miembros  iguales  de  la  comision. 


UNA  REGLA  DE  CONTEO  PARA  COMBINACIONES 

El  numero  de  combinaciones  distintas  de  n  objetos  distintos  que  se  pueden  formar, 
tomando  r  de  ellos  a  un  tiempo,  es 

r"  —  Ul 
r~  r\(n  -  r)\ 

El  numero  de  combinaciones  y  el  numero  de  permutaciones  estan  relacionados: 


Se  puede  ver  que  C"  resulta  cuando  se  divide  el  numero  de  permutaciones  entre  r\,  el 
numero  de  formas  de  reacomodar  cada  grupo  distinto  de  r  objetos  escogidos  de  entre 
el  total  n. 

Una  tarjeta  de  circuito  impreso  se  puede  comprar  de  entre  cinco  proveedores.  £ En  cuan- 
tas  formas  se  pueden  escoger  tres  proveedores  de  entre  los  cinco? 


Solucion  Como  es  solo  importante  cuales  tres  se  han  escogido,  no  el  orden  de  selec¬ 
cion,  el  numero  de  formas  es 
5!  (5)(4) 


c\ ;  = 


3!2! 


=  10 


El  siguiente  ejemplo  ilustra  el  uso  de  reglas  de  conteo  para  resolver  un  problema  de 
probabilidad. 


Cinco  fabricantes  producen  cierto  aparato  electronico,  cuya  calidad  varfa  de  un  fabri- 
cante  a  otro.  Si  fueramos  a  seleccionar  tres  fabricantes  al  azar,  ^cual  es  la  probabilidad 
de  que  la  seleccion  contenga  exactamente  dos  de  los  tres  mejores? 

Solucion  Los  eventos  simples  de  este  experimento  estan  formados  por  todas  las 
posibles  combinaciones  de  tres  fabricantes,  escogidos  de  un  grupo  de  cinco.  De  estos 
cinco,  tres  han  sido  designados  como  “mejores”  y  dos  como  “no  mejores”.  Se  puede 
pensar  en  un  plato  de  dulces  que  contenga  tres  dulces  rojos  y  dos  amarillos,  de  los  cuales 
se  seleccionan  tres,  como  se  ilustra  en  la  figura  4.7.  El  numero  total  de  eventos  sim¬ 
ples  N  se  puede  contar  como  el  numero  de  formas  para  escoger  tres  de  los  cinco  fabri¬ 
cantes,  o  sea 


N=  Cl 


5! 

3!2! 


10 
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Como  los  fabricantes  se  seleccionan  al  azar,  cualquiera  de  estos  10  eventos  simples 
sera  igualmente  probable,  con  probabilidad  1/10.  Pero  cuantos  de  estos  eventos  sim¬ 
ples  resultan  en  el  evento 

A:  exactamente  dos  de  los  “mejores”  tres 


Se  puede  contar  nA,  el  numero  de  eventos  en  A,  en  dos  pasos  porque  el  evento  A  ocurrira 
cuando  seleccione  dos  de  los  “mejores”  tres  y  uno  de  los  dos  “no  mejores”.  Hay 


cl  = 


3! 

2!  1 ! 


=  3 


formas  de  efectuar  la  primera  etapa  y 

2! 


C\  = 


111! 


=  2 


formas  de  efectuar  la  segunda  etapa.  Aplicando  la  Regia  mn,  encontramos  que  hay  nA  = 
(3)(2)  =  6  de  los  10  eventos  sencillos  en  el  evento  A  y  P(A)  =  nA/N  =  6/10. 


Existen  muchas  otras  reglas  de  conteo  ademas  de  las  tres  presentadas  en  esta  section. 
Si  usted  esta  interesado  en  este  tema,  consulte  uno  de  los  numerosos  libros  de  texto  sobre 
matematicas  combinatorias. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

4.17  Usted  tiene  dos  grupos  de  objetos  muy  diferentes, 
10  en  el  primer  grupo  y  ocho  en  el  segundo.  Si  selecciona 
un  objeto  de  cada  grupo,  ^cuantos  pares  diferentes  puede 
formar? 

4.18  Usted  tiene  tres  grupos  de  objetos  muy  diferentes, 
cuatro  en  el  primer  grupo,  siete  en  el  segundo  y  tres  en 
el  tercero.  Si  selecciona  un  objeto  de  cada  gmpo, 

/  cuantas  ternas  diferentes  puede  formar? 

4.19  Permutaciones  Evalue  las  siguientes 
permutaciones.  (sugerencia:  Su  calculadora  cientifica 
puede  tener  una  funcion  que  permita  calcular 
permutaciones  y  combinaciones  con  gran  facilidad.) 

a.  P\  b.  Pl09  c.  P\  d.  P  T 

4.20  Combinaciones  Evalue  estas  combinaciones : 
a.  Cl  b.  C1,0  c.  C\  d.  Cj° 

4.21  Seleccionar  personas  ^En  cuantas  formas  se 
pueden  seleccionar  cinco  personas  de  entre  un  grupo  de 
ocho  si  el  orden  de  seleccion  es  importante? 


4.22  Seleccionar  personas,  otra  vez  ^En  cuantas 
formas  se  pueden  seleccionar  dos  personas  de  entre  un 
grupo  de  20  si  el  orden  de  seleccion  es  importante? 

4.23  Dados  Se  tiran  tres  dados.  ^Cuantos  eventos 
simples  hay  en  el  espacio  muestral? 

4.24  ilVIonedas  Se  tiran  al  aire  cuatro  monedas. 
^Cuantos  eventos  simples  hay  en  el  espacio  muestral? 

4.25  Un  problema  de  urna,  otra  vez  Se  seleccionan 
tres  pelotas  de  una  caja  que  contiene  10  de  ellas.  El  orden 
de  seleccion  no  es  importante.  ^Cuantos  eventos  simples 
hay  en  el  espacio  muestral? 

APLICACIONES 

4.26  iQue  ropa  usar?  Usted  tiene  cuatro  pares  de 
jeans,  12  playeras  limpias  y  cuatro  pares  de  zapatos 
tenis.  ^  Cuantas  combinaciones  de  ropa  (jeans,  playeras  y 
zapatos  tenis)  puede  crear? 

4.27  Itinerarios  Un  hombre  de  negocios  en  Nueva 
York  esta  preparando  un  itinerario  para  visitar  seis 
ciudades  principales.  La  distancia  recorrida,  y  por  tanto 
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el  costo  del  viaje,  dependent  del  orden  en  el  que  planee 
su  ruta.  yCuantos  itinerarios  diferentes  (y  costos  de  viaje) 
son  posibles? 

4.28  Planes  de  vacaciones  Las  vacaciones  de  su 
familia  consisten  en  un  viaje  en  avion  por  el  pais,  rentar 
un  auto  y  una  estancia  en  un  hotel  de  Boston.  Si  usted 
puede  escoger  de  entre  cuatro  lrneas  aereas  principales, 
cinco  agendas  de  renta  de  autos  y  tres  cadenas  hoteleras 
principales,  yen ant as  opciones  hay  para  lugares  en  sus 
vacaciones? 

4.29  Un  juego  de  cartas  Tres  estudiantes  estan 
jugando  a  las  cartas.  Deciden  escoger  al  primero 
en  jugar  al  seleccionar  cada  uno  de  ellos  una  tarjeta 
de  entre  el  mazo  de  52  cartas  y  ver  la  de  mayor  valor 
y  palo.  Ordenan  los  palos  de  menor  a  mayor:  treboles, 
diamantes,  corazones  y  espadas. 

a.  Si  la  carta  se  devuelve  al  mazo  despues  de  que  cada 
estudiante  escoja,  ^cuantas  configuraciones  son 
posibles  de  entre  las  tres  selecciones? 

b.  yCuantas  configuraciones  hay  en  las  que  cada 
estudiante  escoge  una  carta  diferente? 

c.  yCual  es  la  probabilidad  de  que  los  tres  estudiantes 
escojan  exactamente  la  misma  carta? 

d.  yCual  es  la  probabilidad  de  que  los  tres  estudiantes 
escojan  cartas  diferentes? 

4.30  Comida  en  el  restaurant  Gerard's  Un 

restaurant  frances  en  Riverside,  California,  ofrece  un 
menu  especial  de  verano  en  el  que,  por  un  costo  fijo  por 
comida,  se  puede  escoger  una  de  dos  ensaladas,  una  de 
dos  entradas  y  uno  de  dos  postres.  ^Cuantas  comidas 
diferentes  hay? 

4.31  Jugador  de  poquer  Se  seleccionan  cinco  cartas 
de  entre  un  mazo  de  52  cartas  para  una  mano  de  poquer. 

a.  yCuantos  eventos  simples  hay  en  el  espacio  muestral? 

b.  Una  escalera  real  es  una  mano  que  contiene  el  A,  K, 
Q,  J  y  10,  todas  del  mismo  palo.  ^Cuantas  formas  hay 
para  obtener  una  escalera  real? 

c.  yCual  es  la  probabilidad  de  recibir  una  escalera  real? 

4.32  Poquer  Consulte  el  ejercicio  4.31.  Usted  tiene 
una  mano  de  poquer  con  cuatro  de  una  clase. 

a.  yCuantas  manos  de  poquer  posibles  puede  recibir? 

b.  6  Ln  cuantas  formas  puede  recibir  cuatro  cartas  del 
mismo  valor  de  cara  y  ademds  una  carta  de  las  otras 
48  cartas? 

c.  yCual  es  la  probabilidad  de  recibir  cuatro  de  una 
clase? 


4.33  Encuesta  en  un  hospital  Se  va  a  efectuar  un 
estudio  en  un  hospital  para  determinar  las  actitudes 
de  las  enfermeras  hacia  diversos  procedimientos 
administrativos.  Si  se  selecciona  una  muestra  de  10 
enfermeras  de  entre  un  total  de  90,  ^cuantas  muestras 
diferentes  se  pueden  seleccionar?  (sugerencia:  ^E1  orden 
es  importante  para  determinar  la  conformation  de  la 
muestra  a  seleccionar  para  el  estudio?) 

4.34  Problemas  de  transito  Se  han  de  seleccionar 
dos  miembros  de  un  concejo  municipal,  de  entre  un  total 
de  cinco,  para  formar  un  subcomite  para  estudiar  los 
problemas  de  transito  de  la  ciudad. 

a.  (\Cuantos  subcomites  diferentes  son  posibles? 

b.  Si  todos  los  posibles  miembros  del  concejo  tienen 
igual  probabilidad  de  ser  seleccionados,  ^cual  es  la 
probabilidad  de  que  sean  seleccionados  Smith  y  Jones? 

4.35  La  WNBA  El  baloncesto  profesional  es  ahora  una 
realidad  para  jugadoras  de  baloncesto  en  Estados  Unidos. 
Hay  dos  conferencias  en  la  WNBA,  cada  una  con  siete 
equipos,  como  se  muestra  en  la  tabla  siguiente. 


Conferencia  del  Oeste 

Houston  Comets 
Minnesota  Lynx 
Phoenix  Mercury 
Sacramento  Monarchs 
Los  Angeles  Sparks 
Seattle  Storm 
San  Antonio  Silver  Stars 


Conferencia  del  Este 

Indiana  Fever 
New  York  Liberty 
Washington  Mystics 
Detroit  Shock 
Charlotte  Sting 
Connecticut  Sun 
Chicago  Sky 


Dos  equipos,  uno  de  cada  conferencia,  se  seleccionan  al 
azar  para  jugar  un  partido  de  exhibition. 

a.  (,Cuantos  pares  de  equipos  se  pueden  escoger? 

b.  (iCual  es  la  probabilidad  de  que  los  dos  equipos  sean 
el  de  Los  Angeles  y  el  de  Nueva  York? 

c.  (iCual  es  la  probabilidad  de  que  el  equipo  de  la 
Conferencia  del  Oeste  sea  de  California? 

4.36  Carrera  de  100  metros,  otra  vez  Consulte  el 
ejercicio  4.14,  en  el  que  John,  Bill,  Ed  y  Dave  corren  un 
sprint  de  100  metros.  Suponga  que  todos  los  corredores 
estan  igualmente  calificados,  de  modo  que  cualquier 
orden  de  terminacion  es  igualmente  probable.  Use  la 
Regia  mn  o  permutaciones  para  contestar  estas  preguntas: 

a.  (\Cuantos  ordenes  de  terminacion  son  posibles? 

b.  (iCual  es  la  probabilidad  de  que  Dave  gane  el  sprint? 

c.  ^Cual  es  la  probabilidad  de  que  Dave  gane  y  John 
obtenga  el  segundo  lugar? 

d.  yCual  es  la  probabilidad  de  que  Ed  termine  en  ultimo 
lugar? 
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4.37  iSesgo  en  el  genero?  El  siguiente  caso  ocurrio 
en  Gainesville,  Florida.  El  Consejo  de  Relaciones 
Humanas  formado  por  ocho  miembros  considero  la 
queja  de  una  mujer  que  alegaba  discriminacion,  con 
base  en  su  genero,  por  parte  de  una  companfa  local  de 
encuestas.  El  consejo,  compuesto  de  cinco  mujeres  y 
tres  hombres,  voto  5-3  a  favor  de  la  demandante,  con 
las  cinco  mujeres  votando  por  ella  y  los  tres  hombres 
en  contra.  El  abogado  representante  de  la  companfa 
apelo  la  decision  del  consejo  alegando  sesgo  de  genero  de 
parte  de  los  miembros  del  consejo.  Si  el  voto  a  favor 
de  la  demandante  fue  5-3  y  los  miembros  del  consejo 
no  estuvieran  sesgados  por  el  genero,  /  cual  es  la 
probabilidad  de  que  el  voto  se  divida  en  lfneas  de  genero 
(cinco  mujeres  a  favor  y  tres  hombres  en  contra)? 


4.38  Estudio  apresurado  Una  estudiante  se  prepara 
para  un  examen  al  estudiar  una  lista  de  10  problemas;  ella 
puede  resolver  seis  de  ellos.  Para  el  examen,  el  profesor 
selecciona  cinco  preguntas  al  azar  de  la  lista  de  10.  ('Cual 
es  la  probabilidad  de  que  la  estudiante  pueda  resolver  los 
cinco  problemas  en  el  examen? 

4.39  Negocio  de  monos  A  un  mono  se  le  dan 
12  bloques:  tres  en  forma  de  cuadrados,  tres  como 
rectangulos,  tres  como  triangulos  y  igual  numero 
como  cfrculos.  Si  saca  tres  de  cada  clase  en  orden,  es 
decir,  tres  triangulos,  luego  la  misrna  cantidad  cuadrados 
y  asf  sucesivamente,  ^sospecharfa  usted  que  el  mono 
asocia  figuras  que  tengan  forma  identica?  Calcule  la 
probabilidad  de  este  evento. 


RELACIONES  DE  EVENTO  Y  REGLAS 
DE  PROBABILIDAD 

Hay  veces  en  que  el  evento  de  interes  se  puede  formar  como  una  combinacion  de  algu- 
nos  otros  eventos.  Sean  Ay  B  dos  eventos  definidos  en  el  espacio  muestral  S.  Aquf  hay 
tres  relaciones  importantes  entre  eventos. 


Definicion  La  union  de  los  eventos  Ay  B,  denotada  por  A  U  B,  es  el  evento  en  que 
ocurren  A  o  B  o  ambos. 


Definicion  La  interseccion  de  eventos  Ay  B,  denotada  por  A  H  B.  es  el  evento  en 
que  ocurren  A  y  B. ' 


Definicion  El  complemento  de  un  evento  A,  denotado  por  Ac,  es  el  evento  en  que 
A  no  ocurre. 


Las  figuras  4.8,  4.9  y  4.10  muestran  representaciones  del  diagrama  de  Venn  de  A  U  B, 
A  Pi  B  y  Ac,  respectivamente.  Cualquier  evento  simple  en  el  area  sombreada  es  un  posi- 
ble  resultado  que  aparece  en  el  evento  apropiado.  Una  forma  de  hallar  las  probabilidades 
de  la  union,  la  interseccion  o  el  complemento  es  sumar  las  probabilidades  de  todos  los 
eventos  simples  asociados. 


t 


Algunos  autores  usan  la  notation  AB. 
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FIGURA  4.8 

Diagrama  de  Venn  de  A  U  B 


FIGURA  4.9 

Diagrama  de  Venn  An  B 


S 


EJEMPLO 


Se  tiran  al  aire  dos  monedas  imparciales  y  se  registra  el  resultado.  Estos  son  los  eventos 
de  interes: 


A:  observar  al  menos  una  cara 
B:  observar  al  menos  una  cruz 


Defina  los  eventos  A,  B,  A  D  B,  A  U  B  y  Ac  como  conjuntos  de  eventos  simples,  y 
encuentre  sus  probabilidades. 

Solucion  Recuerde  del  ejemplo  4.5  que  los  eventos  simples  para  este  experimento 
son 


HH  (cara  en  primera  moneda,  cara  en  segunda) 

E2:  HT 
£3:  TH 
E4:  TT 

y  que  cada  evento  simple  tiene  probabilidad  1/4.  El  evento  A,  al  menos  una  cara,  se  pre- 
senta  si  ocurre  El:  E-,  o  Ei:  de  modo  que 

A={EuE2,E3}  P(A)  =  | 

y 

=  {E4}  P{Ac)  =  I 


www.FreeLibros.me 


1  46  O  CAPiTULO  4  PROBABILIDAD  Y  DISTRIBUCIONES  DE  PROBABILIDAD 


Del  mismo  modo. 


B  =  { E2,  E3,  £4} 

A  (1  B  =  {E2,  £3} 

A  U  B  =  [Ei,  E2,  £3,  £4} 


P(B )  =  | 

£(A  flB)  =  i 
£(A  U  £)  =  |  =  1 


Observe  que  (A  U  fi)  =  5,  el  espacio  muestral  y  entonces  no  es  seguro  que  ocurra. 


El  concepto  de  uniones  e  intersecciones  se  puede  ampliar  a  mas  de  dos  eventos. 
Por  ejemplo,  la  union  de  tres  eventos  A,  B  y  C,  que  se  escriben  como  A  U  B  U  C,  es 
el  conjunto  de  eventos  simples  que  estan  en  A  o  B  o  C  o  en  cualquier  combination  de 
esos  eventos.  Analogamente,  la  interseccion  de  los  tres  eventos  A,  B  y  C,  que  se  escribe 
como  A  fl  B  Pi  C,  es  el  conjunto  de  eventos  simples  que  son  comunes  a  los  tres  eventos 
A,ByC. 

Calculo  de  probabilidades  para  uniones 
y  complementos 

Cuando  podemos  escribir  el  evento  de  interes  en  la  forma  de  una  union,  un  complemento 
o  una  interseccion,  hay  reglas  de  probabilidad  especiales  que  pueden  simpliiicar  nues- 
tros  calculos.  La  primera  regia  se  refiere  a  uniones  de  eventos. 


REGLA  DE  LA  ADICION 

Dados  dos  eventos,  A  y  B,  la  probabilidad  de  su  union,  A  U  B,  es  igual  a 
P(A  U  B)  =  P(A )  +  P(B)  -  P(A  n  B) 


Observe  en  el  diagrama  de  Venn  en  la  figura  4.1 1  que  la  suma  £(A)  +  P(B)  cuenta  dos 
veces  los  eventos  simples  que  son  comunes  a  A  y  B.  La  resta  de  P(A  Ll  B)  da  el  resultado 
correcto. 


figura  4. 1 1 

Regia  de  la  adicion 


S 


Cuando  dos  eventos  A  y  B  son  mutuamente  excluyentes  o  disjuntos,  significa  que  cuando 
ocurre  A,  B  no  puede  ocurrir,  y  viceversa.  Esto  significa  que  la  probabilidad  de  que  ambos 
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ocurran,  P(A  n  B ),  debe  ser  cero.  La  figura  4.12  es  una  representacion  de  un  diagrama  de 
Venn  de  dos  de  estos  eventos  sin  ningun  evento  simple  en  conuin. 


FIGURA  4. 1  2 

Dos  eventos  disjuntos 


CONSEJO 


Recuerde,  mutuamente 
excluyente  <=>  (A  n  B)  =  0. 


S 


Cuando  dos  eventos  Ay  B  son  mutuamente  excluyentes,  entonces  P(A  DS)  =  0 
y  la  Regia  de  la  adicion  se  simplifica  a 

P(A  U  B)  =  P(A)  +  P(B) 


La  segunda  regia  se  refiere  a  complementos  de  eventos.  Se  puede  ver  del  diagrama  de 
Venn  de  la  figura  4.10  que  A  y  Ac  son  mutuamente  excluyentes  y  que  A  U  Ac  =  S,  todo 
el  espacio  muestral.  Se  deduce  que 

P(A)  +  P(AC )  =  1  y  P(A')  =  1  -  P(A) 


REGLA  PARA  COMPLEMENTOS 

P(A'  )  =  1  -  P(A) 


Un  companfa  de  exploracion  petrolera  planea  perforar  dos  pozos  de  exploracion.  Se 
emplea  evidencia  del  pasado  para  tener  acceso  a  los  posibles  resultados  de  la  tabla  4.4. 


TABLA  4.4  Resultados  para  el  experimento  de  perforacion  petrolifera 

Evento  Descripcion  Probabilidad 


4 

Ningun  pozo  produce  petroleo  ni  gas 

.80 

B 

Exactamente  un  pozo  produce  petroleo  o  gas 

.18 

C 

Ambos  pozos  producen  petroleo  o  gas 

.02 

Encuentre  P(A  U  B)  y  P(B  U  C). 

Solucion  Por  su  definicion,  los  eventos  A,  B  y  C  son  mutuamente  excluyentes  en 
forma  conjunta  porque  el  suceso  de  un  evento  impide  que  ocurra  cualquiera  de  los  otros 
dos.  Por  tanto, 

P(A  U  B)  =  P(A )  +  P(B)  =  .80  +  .18  =  .98 


y 

P(BU  C)  =  P(B)  +  P(C)  =  .18  +  .02  =  .20 
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E  J  E  M  P  L 


TABLA  4. 


El  evento  A  U  B  se  puede  describir  como  el  evento  de  que  a  lo  sumo  un  pozo  pro¬ 
duce  petroleo  o  gas,  y  B  U  C  describe  el  evento  de  que  a l  menos  un  pozo  produce  gas 
o  petroleo. 


En  una  encuesta  telefonica  hecha  a  mil  adultos,  a  los  que  respondieron  se  les  pregunto 
acerca  del  gasto  de  una  education  universitaria  y  la  relativa  necesidad  de  alguna  forma  de 
ayuda  financiera.  Quienes  respondieron  fueron  clasificados  de  acuerdo  a  si  actualmente 
tertian  un  hijo  en  la  universidad  y  si  pensaban  que  la  carga  de  un  prestamo  para  casi  todos 
los  estudiantes  universitarios  es  demasiado  alta,  la  cantidad  correcta  o  es  muy  poco.  Las 
proporciones  de  quienes  contestaron  se  muestran  en  la  tabla  de  probabilidad  de  la  tabla 
4.5.  Suponga  que  un  entrevistado  se  escoge  al  azar  de  entre  este  grupo. 

Tabla  de  probabilidad 

Demasiado  alta  Cantidad  correcta  Muy  poco 
W) (B) (C) 

Hijo  en  universidad  .35  .08  .01 

Sin  hijo  en  univ.  .25  .20  .11 


1.  <;Cual  es  la  probabilidad  de  que  el  entrevistado  tenga  un  hijo  en  la  universidad? 

2.  <;Cual  es  la  probabilidad  de  que  el  entrevistado  no  tenga  un  hijo  en  la  universidad? 

3.  ^Cual  es  la  probabilidad  de  que  el  entrevistado  tenga  un  hijo  en  la  universidad 
o  piense  que  la  carga  de  un  prestamo  es  demasiado  alta? 

Solucion  La  tabla  4.5  da  las  probabilidades  para  los  seis  eventos  simples  de  las  cel- 
das  de  la  tabla.  Por  ejemplo,  la  entrada  en  la  esquina  superior  izquierda  de  la  tabla  es  la 
probabilidad  de  que  un  entrevistado  tenga  un  hijo  en  la  universidad  y  ademds  piense  que 
la  carga  de  un  prestamo  es  demasiado  alta  ( A  n  D). 

1.  El  evento  de  que  un  entrevistado  tenga  un  hijo  en  la  universidad  ocurrira,  cual- 
quiera  que  sea  su  respuesta  a  la  pregunta  acerca  de  la  carga  por  el  prestamo.  Esto 
es,  el  evento  D  consta  de  los  eventos  simples  del  primer  renglon: 

P(D)  =  .35  +  .08  +  .01  =  .44 

En  general,  las  probabilidades  de  eventos  marginales  como  D  y  A  se  encuentran 
al  sumar  las  probabilidades  en  el  renglon  o  columna  apropiados. 

2.  El  evento  de  que  el  entrevistado  no  tiene  un  hijo  en  la  universidad  es  el  comple- 
mento  del  evento  D  denotado  por  Dc.  La  probabilidad  de  D'  se  encuentra  como 

P(DC)  =  1  -  P(D) 

Usando  el  resultado  del  punto  1,  tenemos 

P(D')  =  1  -  .44  =  .56 

3.  El  evento  de  interes  es  P(A  U  D).  Usando  la  Regia  de  la  adicion, 

P(A  U  D)  =  P(A)  +  P(D)  -  P(A  n  D) 

=  .60  +  .44  -  .35 

=  .69 
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INDEPENDENCE,  PROBABILIDAD 
CONDICIONAL  Y  LA  REGLA 
DE  LA  MULTIPLICACION 

Hay  una  regia  de  la  probabilidad  que  se  puede  usar  para  calcular  la  probabilidad  de  la 
intersection  de  varios  eventos,  pero  esta  regia  depende  del  importante  concepto  estadfs- 
tico  de  eventos  independientes  o  dependientes. 


Definicion  Se  dice  que  dos  eventos,  Ay  B,  son  independientes  si  y  solo  si  la  pro¬ 
babilidad  del  evento  B  no  esta  influenciada  o  cambiada  por  el  suceso  del  evento  A,  o 
viceversa. 


Daltonismo  Suponga  que  un  observador  ve  el  genera  de  una  persona  y  si  esta 
no  distingue  los  colores  rojo  y  verde.  ^Cambia  la  probabilidad  de  que  una  persona  sea 
daltonica,  dependiendo  de  si  es  hombre  o  no?  Defina  dos  eventos: 

A:  la  persona  es  hombre 
B:  la  persona  es  daltonica 

En  este  caso,  como  el  daltonismo  es  una  caracterfstica  relacionada  con  el  sexo  mascu- 
lino,  la  probabilidad  de  que  un  hombre  sea  daltonico  sera  mayor  que  la  probabilidad 
de  que  una  persona  escogida  de  la  poblacion  general  sea  daltonica.  La  probabilidad  del 
evento  B,  que  una  persona  sea  daltonica,  depende  de  si  ha  ocurrido  o  no  ha  ocurrido 
el  evento  A,  que  la  persona  sea  hombre.  Decimos  que  Ay  B  son  eventos  dependientes. 

Tirar  dados  Por  el  contrario,  considere  tirar  un  solo  dado  dos  veces  y  defina  dos 
eventos: 

A:  observar  un  2  en  el  primer  tiro 
B:  observar  un  2  en  el  segundo  tiro 

Si  el  dado  es  imparcial,  la  probabilidad  del  evento  A  es  P(A)  =  1/6.  Considere  la  proba¬ 
bilidad  del  evento  B.  Ya  sea  que  el  evento  A  haya  ocurrido  o  no  haya  ocurrido,  la  pro¬ 
babilidad  de  observar  un  2  en  el  segundo  tiro  todavfa  es  1/6.  Podrfamos  escribir: 

P(B  dado  que  A  ocurrio)  =  1/6 
P(B  dado  que  A  no  ocurrio)  =  1/6 

Como  la  probabilidad  del  evento  B  no  ha  cambiado  por  el  suceso  del  evento  A,  decimos 
que  Ay  B  son  eventos  independientes. 

La  probabilidad  de  un  evento  A,  dado  que  el  evento  B  ha  ocurrido,  se  denomina  pro¬ 
babilidad  condicional  de  A,  dado  que  B  ha  ocurrido,  denotada  por  P(A\B).  La  barra 
vertical  se  lee  “dada”  y  los  eventos  que  aparecen  a  la  derecha  de  la  barra  son  aquellos 
que  se  sabe  han  ocurrido.  Usaremos  estas  probabilidades  para  calcular  la  probabilidad 
de  que  Ay  B  ocurran  cuando  se  realice  el  experimento. 


REGLA  GENERAL  DE  LA  MULTIPLICACION 

La  probabilidad  de  que  Ay  B  ocurran  cuando  el  experimento  se  realiza  es 
P(A  DB)  =  P(A)P(B\A) 
o 

P(A  DB)  =  P(B)P(A\B) 
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En  un  experimento  de  preferencia  de  color,  ocho  juguetes  se  ponen  en  un  recipiente. 
Los  juguetes  son  identicos  excepto  por  el  color,  dos  son  rojos  y  seis  son  verdes.  Se  pide 
a  un  nino  que  escoja  dos  juguetes  al  azar.  ^Cual  es  la  probabilidad  de  que  el  nino  escoja 
los  dos  juguetes  rojos? 

Solucion  Se  puede  visualizar  el  experimento  usando  un  diagrama  de  arbol  como  se 
muestra  en  la  figura  4.13.  Defina  los  eventos  siguientes: 

R:  se  escoge  juguete  rojo 

G:  se  escoge  juguete  verde 


FIGURA  4. 1  3 

Diagrama  de  arbol  para  el 
ejemplo  4.19 


Primera  selection  Segunda  selection  Evento  simple 


Rojo  (1/7) 


RR 

RG 

GR 

GG 


El  evento  A  (ambos  juguetes  son  rojos)  se  puede  construir  como  la  intersection  de  dos 
eventos: 

A  =  (R  en  la  primera  seleccion)  Pi  (R  en  la  segunda  seleccion) 

Como  solo  hay  dos  juguetes  rojos  en  el  recipiente,  la  probabilidad  de  escoger  el  rojo  en 
la  primera  seleccion  es  2/8.  No  obstante,  una  vez  que  haya  sido  escogido  este  juguete 
rojo,  la  probabilidad  del  rojo  en  la  segunda  seleccion  depende  del  resultado  de  la  primera 
seleccion  (vease  la  figura  4. 13).  Si  la  primera  seleccion  fue  un  juguete  rojo,  la  probabili¬ 
dad  de  escoger  un  segundo  juguete  rojo  es  solo  1/7  porque  hay  solo  un  juguete  rojo  entre 
los  siete  restantes.  Si  la  primera  seleccion  fue  verde,  la  probabilidad  de  escoger  rojo 
en  la  segunda  seleccion  es  2/7  porque  hay  dos  juguetes  rojos  entre  los  siete  restantes. 
Usando  esta  information  y  la  Regia  de  la  multiplicacion,  se  puede  hallar  la  probabilidad 
del  evento  A. 


P(A) 


P( R  en  la  primera  seleccion  Pi  R  en  la  segunda  seleccion) 

R(R  en  la  primera  seleccion)  /J(R  en  la  segunda  seleccion)  |R  en  la  primera) 


2  _  1 
56  ~~  28 


A  veces  es  necesario  usar  la  Regia  de  la  multiplicacion  en  una  forma  ligeramente  dife- 
rente,  de  modo  que  se  puede  calcular  la  probabilidad  condicional,  P{A\B).  Solo  reaco- 
mode  los  terminos  de  la  Regia  de  la  multiplicacion. 
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PROBABILIDADES  CONDICIONALES 


La  probabilidad  condicional  del  evento  A,  dado  que  el  evento  B  ha  ocurrido,  es 
P(A\B)  =  si  P(B)±  o 

La  probabilidad  condicional  del  evento  B,  dado  que  el  evento  A  ha  ocurrido,  es 
P(B\A)  =  P(Ap(A}B)  si  P(A)=P  0 


Daltonismo,  continua  Suponga  que  en  la  poblacion  general,  hay  51%  de  hom- 
bres  y  49%  de  mujeres,  y  que  las  proporciones  de  hombres  y  mujeres  daltonicos  se 
muestran  en  la  siguiente  tabla  de  probabilidad: 

Hombres  [B]  Mujeres  (Bc)  Total 

Daltonico  (4)  .04  .002  .042 

No  daltonico  [Ac)  .47  .488  .958 

Total  .51  .49  1.00 


Si  una  persona  se  escoge  al  azar  de  entre  esta  poblacion  y  se  encuentra  que  es  hombre 
(evento  B),  ^cual  es  la  probabilidad  de  que  el  hombre  sea  daltonico  (evento  A)?  Si  sabe- 
mos  que  el  evento  B  ha  ocurrido,  debemos  restringir  nuestra  atencion  a  solo  5 1  %  de  la 
poblacion  que  es  de  hombres.  La  probabilidad  de  ser  daltonico,  dado  que  la  persona  es 
hombre,  es  4%  de  5 1  %,  o  sea 


P(A\B) 


P(A  n  B)  ^04 
P(B)  .51  ' 


^Cual  es  la  probabilidad  de  ser  daltonico,  dado  que  la  persona  es  mujer?  Aliora  estamos 
restringidos  a  solo  el  49%  de  la  poblacion  que  es  de  mujeres  y 


P(A\BC) 


P{A  n  Bc) 
P(BC) 


=  xm 

.49 


=  .004 


Observe  que  la  probabilidad  del  evento  A  cambio,  dependiendo  de  si  el  evento  B  ocurrio. 
Esto  indica  que  estos  dos  eventos  son  dependientes. 


Cuando  dos  eventos  son  independientes,  es  decir,  si  la  probabilidad  del  evento  B  es 
igual,  ya  sea  que  el  evento  A  haya  o  no  haya  ocurrido,  entonces  el  evento  A  no  afecta  al 
evento  B  y  entonces 

P(B\A)  =  P(B ) 

Ahora  se  puede  simplificar  la  Regia  de  la  multiplicacion. 


LA  REGLA  DE  LA  MULTIPLICACION  PARA  EVENTOS 
INDEPENDIENTES 

Si  dos  eventos  Ay  B  son  independientes,  la  probabilidad  de  que  ocurran  Ay  B  es 
P(A  DB)  =  P(A)P(B) 

Del  mismo  modo,  si  A,  By  C  son  eventos  mutuamente  independientes  (todos  los  pares 
de  eventos  son  independientes),  entonces  la  probabilidad  de  que  A,  B  y  C  ocurran  es 

P(A  n  B  n  O  =  P(A)P(B)P(C) 
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Tiros  de  monedas  en  juegos  de  futbol  Un  equipo  de  futbol  interviene  en 
dos  periodos  de  tiempo  extra  durante  un  juego  determinado,  de  modo  que  hay  tres  tiros 
de  monedas  al  aire.  Si  la  moneda  es  imparcial,  cual  es  la  probabilidad  de  que  pierdan 
los  tres  tiros? 

Solucion  Si  la  moneda  es  imparcial,  el  evento  se  puede  describir  en  tres  pasos: 

A:  perder  el  primer  tiro 
B:  perder  el  segundo  tiro 
C:  perder  el  tercer  tiro 

Como  los  tiros  son  independientes  y  como  P(gana)  =  P(pierde)  =  .5  para  cualquiera  de 
los  tres  tiros, 

P(A  n  B  n  C)  =  P(A)P(B)P(Q  =  (.5)(.5)(.5)  =  .125 

(  Como  se  puede  verificar  si  los  dos  eventos  son  independientes  o  dependientes?  La  solu¬ 
cion  mas  facil  es  redefinir  el  concepto  de  independencia  en  un  modo  mas  formal. 


VERIFICACION  DE  INDEPENDENCIA 

Se  dice  que  dos  eventos  Ay  B  son  independientes  si  y  solo  si 
P(A  PB)  =  P(A)P(B) 
o  bien, 

P(B\A)  =  P(B) 

De  otro  modo,  se  dice  que  los  eventos  son  dependientes. 


Tire  al  aire  dos  monedas  y  observe  el  resultado.  Defina  estos  eventos: 

A:  cara  en  la  primera  moneda 
B:  cruz  en  la  segunda  moneda 


Recuerde,  independencia  <=> 
P(ATB)  =  P(A)P(B). 


I  Los  eventos  Ay  B  son  independientes? 

De  los  ejemplos  previos,  sabemos  que  S  =  {HH,  HT,  TH,  TT}.  Utilice 
estos  cuatro  eventos  simples  para  hallar 

P(A)  =  -,  P(B)  =  -  y  P(A  d  B)  = 

2  2  4 

Como  P{A)P{B)  =  i  y  P(A  Cl  B)  =  i,  tenemos  P(A)P(B)  =  P{A  n  B)  y 

los  dos  eventos  deben  ser  independientes. 


Consulte  la  tabla  de  probabilidad  del  ejemplo  4.18,  que  se  reproduce  a  continuacion: 

Demasiado  alto  Cantidad  correcta  Muypoco 
(A)  ( B )  (C) 

Hijo  en  universidad  [D]  .35  .08  .01 

Sin  hijo  en  universidad  (£)  .25  .20  .11 

l  Los  eventos  Dy  A  son  independientes?  Explique. 
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Solucion 

1.  Utilice  la  tabla  de  probabilidad  para  hallar  P(A  D  D)  =  .35,  P(A)=  .60  y 
P(D )  =  .44.  Entonces 

P(A)P(D )  =  (.60)(.44)  =  .264  y  P(A  n  D)  =  .35 

Como  estas  dos  probabilidades  no  son  iguales,  los  eventos  Ay  D  son  dependientes. 

2.  Alternativamente,  calcule 

P(A\D)  =  ~ApPo]~  =  jf  =  -80 

Como  P(A\D)  =  .80  y  P(A )  =  .60,  de  nuevo  esto  nos  lleva  a  la  conclusion  de  que 
los  eventos  Ay  D  son  dependientes. 


^Cual  es  la  diferencia  entre  eventos  mutuamente 
excluyentes  y  eventos  independientes? 

Muchos  estudiantes  encuentran  diffcil  decir  la  diferencia  entre  eventos  mutuamente 
excluyentes  y  eventos  independientes. 

•  Cuando  dos  eventos  son  mutuamente  excluyentes  o  disjuntos,  no  pueden  ocu- 
rrir  los  dos  cuando  se  realice  el  experimento.  Una  vez  ocurrido  el  evento  B,  el 
evento  A  no  puede  ocurrir,  de  modo  que  P(A\B)=  0,  o  viceversa.  El  suceso 
del  evento  B  ciertamente  afecta  la  probabilidad  de  que  el  evento  A  pueda 
ocurrir. 

•  Por  tanto,  los  eventos  mutuamente  excluyentes  deben  ser  dependientes. 

•  Cuando  dos  eventos  son  mutuamente  excluyentes  o  disjuntos, 

P(A  n  B)  =  0  y  P(A  U  B)=  P(A)  +  P(B). 

•  Cuando  dos  eventos  son  independientes, 

P(A  n  B)  =  P(A)P(B)  y  P(A  U  B)  =  P(A)  +  P(B)  -  P(A)P(B). 

Repertorio  de  ejercicios 

Use  las  relaciones  citadas  lmeas  antes  para  llenar  los  espacios  en  bianco  de  la  tabla 
siguiente. 


Las  respuestas  estan  en  la  tarjeta  perforada  al  final  de  este  libro. 


El  uso  de  reglas  de  probabilidad  para  calcular  la  probabilidad  de  un  evento  requiere 
alguna  experiencia  e  ingenio.  Es  necesario  expresar  el  evento  de  interes  como  una  union 
o  intersection  (o  la  combination  de  ambas)  de  dos  o  mas  eventos  cuyas  probabilidades 
son  conocidas  y  se  calculan  con  facilidad.  Es  frecuente  que  se  pueda  hacer  esto  en  dife- 
rentes  formas;  la  clave  es  hallar  la  combination  correcta. 
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Se  sacan  dos  cartas  de  un  mazo  de  52.  Calcule  la  probabilidad  de  que  el  saque  incluya 
un  as  y  un  diez. 

Solucion  Considere  el  evento  de  interes: 

A:  sacar  un  as  y  un  10 


Entonces  A  =  B  U  C,  donde 

B:  sacar  un  as  en  el  primer  saque  y  un  10  en  el  segundo 
C:  sacar  un  10  en  el  primer  saque  y  un  as  en  el  segundo 

Los  eventos  B  y  C  se  escogen  como  mutuamente  excluyentes  y  tambien  como  intersec- 
ciones  de  eventos  con  probabilidades  conocidas;  esto  es, 

B  =  Bi  n  Bi  y  C  =  Ci  n  C2 

donde 


Bp  sacar  un  as  en  el  primer  saque 
Bi\  sacar  un  10  en  el  segundo  saque 
C,:  sacar  un  10  en  el  primer  saque 
C2:  sacar  un  as  en  el  segundo  saque 


Aplicando  la  Regia  de  la  multiplication,  tenemos 

p(b,  n  b2)  =  m-o/mlri,) 

V52/V51/ 


P(C,  n  C2)  = 


r4-  F- 

V52/V5E 

Entonces,  aplicando  la  Regia  de  la  adicion, 


P(A )  =  P(B)  +  P(C) 

_  M  Vj_\  +  /4_V_4_\  _  J_ 

V52/V51/  V52A5I/  663 

Con  todo  cuidado  verifique  cada  composicion  para  asegurarse  que  en  realidad  es  igual 
al  evento  de  interes. 


0 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  ref i ere n  a  la  seccion  Mi  entrenador  personal  de  la  pagina  153. 

4.40  Use  las  relaciones  de  eventos  para  llenar  los  espacios  en  bianco  de  la  tabla  siguiente. 


P(A ) 

P(B) 

Condiciones  para  eventos  A  y  B 

P(A  n  B) 

P{A  U  B) 

P(A\B) 

.3 

.4 

.12 

.3 

.4 

.7 

.1 

.5 

Mutuamente  excluyentes 

.2 

.5 

Independientes 
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4.41  Use  relaciones  de  evento  para  llenar  los  espacios  en  bianco  de  la 
tabla  siguiente. 


P[A) 

P[B) 

Condiciones  para  eventos  A  y  B 

P[A  n  B) 

P(A  U  B) 

P(A\B) 

.3 

.4 

.3 

.4 

.1 

.5 

Mutuamente  excluyentes 

.1 

.2 

.5 

Independientes 

0 

TECNICAS  BASICAS 

4.42  Un  experimento  puede  resultar  en  uno  de  cinco 

eventos  simples  igualmente  probables,  Eu  E2, .  .  . ,  £5. 
Los  eventos  A,  B  y  C  se  definen  como  sigue: 

A:  Eu  £3  P(A)  =  .4 

B :  Eu  E2,  £4,  £5  P(B)  =  .8 

C:  £3,  £4  P{C)  =  .4 

Encuentre  las  probabilidades  asociadas  con  estos  eventos 
compuestos,  haciendo  una  lista  de  los  eventos  simples  en 
cada  uno. 

a.  Ac  b.  A  n  B  c.  B  D  C 

d.  A  U  B  e.  B\C  f.  A\B 

g.  A  U  B  U  C  h.  (A  n  B)c 

4.43  Consulte  el  ejercicio  4.42.  Use  la  definicion  de  un 

evento  complementario  para  hallar  estas  probabilidades: 
a.  P(AC)  b.  P«A  n  B)c) 

l  Los  resultados  concuerdan  con  los  obtenidos  en  el 
ejercicio  4.42? 

4.44  Consulte  el  ejercicio  4.42.  Use  la  definicion  de 

probabilidad  condicional  para  hallar  estas  probabilidades: 
a.  P(A\B)  b.  P(B\C) 

l  Los  resultados  concuerdan  con  los  obtenidos  en  el 
ejercicio  4.42? 

4.45  Consulte  el  ejercicio  4.42.  Use  las  Reglas  de 
la  adicion  y  de  la  multiplicacion  para  hallar  estas 
probabilidades: 

a.  P(A  U  B )  b.  P(A  Cl  B)  c.  P(B  Cl  Q 

('.Los  resultados  concuerdan  con  los  obtenidos  en  el 
ejercicio  4.42? 

4.46  Consulte  el  ejercicio  4.42. 

a.  i,Los  eventos  Ay  B  son  independientes? 

b.  (',L°s  eventos  Ay  B  son  mutuamente  excluyentes? 

4.47  Dados  Un  experimento  consiste  en  tirar  un  solo 
dado  y  observar  el  numero  de  puntos  que  aparecen  en  la 
cara  superior.  Los  eventos  A,  B  y  C  estan  definidos  como 
sigue: 


A:  observar  un  numero  menor  a  4 
B:  observar  un  numero  menor  o  igual  a  2 
C:  observar  un  numero  mayor  a  3 

Encuentre  las  probabilidades  asociadas  con  los  eventos 
citados  a  continuacion,  usando  ya  sea  el  metodo  de 
evento  simple  o  las  reglas  y  definiciones  de  esta  section, 
a.  S  b.  A\B  c.  B 

d.  ADB  DC  e.  ADB  f.  AH  C 

g.  B  DC  h.  A  U  C  i.  BU  C 

4.48  Consulte  el  ejercicio  4.47. 

a.  ('.Los  eventos  Ay  B  son  independientes?  ^Mutuamente 
excluyentes? 

b.  (',Los  eventos  Ay  C  son  independientes?  £  Mutuamente 
excluyentes? 

4.49  Suponga  que  P(A)  =  .4  y  P(B)  =  .2.  Si  los 
eventos  Ay  B  son  independientes,  encuentre  estas 
probabilidades: 

a.  P(A  n  B )  b.  P(A  U  B) 

4.50  Suponga  que  P(A)  =  .3  y  P(B)  =  .5.  Si  los  eventos 
Ay  B  son  mutuamente  exclusivos,  encuentre  estas 
probabilidades: 

a.  P(A  Cl  B )  b.  P(A  U  B) 

4.51  Suponga  que  P(A)  =  .4  y  P(A  Cl  B)  =  .12. 

a.  Encuentre  P(B | A). 

b.  (',Los  eventos  Ay  B  son  mutuamente  excluyentes? 

c.  Si  P(B)  =  .3,  ,4os  eventos  Ay  B  son  independientes? 

4.52  Un  experimento  puede  resultar  en  uno  o  ambos  de 
los  eventos  Ay  B  con  las  probabilidades  que  se  muestran 
en  esta  tabla  de  probabilidad: 


A 

Ac 

B 

.34 

.46 

Bc 

.15 

.05 

Encuentre  las  siguientes  probabilidades: 

a.  P(A)  b.  P(B)  c.  P(A  Cl  B ) 

d.  £(A  U  B )  e.  P(A\B)  f.  P(B\A) 
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4.53  Consulte  el  ejercicio  4.52. 

a.  (',Los  eventos  Ay  B  son  mutuamente  excluyentes? 
Explique. 

b.  <,Los  eventos  Ay  B  son  independientes?  Explique. 

APLICACIONES 

4.54  ’rueba  de  medicamentos  Numerosas 
compamas  estan  examinando  empleados  prospectos  para 
ver  si  consumen  drogas,  con  la  intention  de  mejorar  la 
eficiencia  y  redutir  el  ausentismo,  accidentes  y  robos. 
Quienes  se  oponen  a  ello  afirman  que  este  procedimiento 
esta  creando  una  clase  de  gentes  a  quienes  no  se  puede 
contratar  y  que  algunas  personas  pueden  ser  puestas  en  esta 
clase  porque  los  examenes  en  si  no  son  100%  confiables. 
Suponga  que  una  compama  utiliza  un  examen  que  es  98% 
confiable,  es  decir,  correctamente  identifica  a  una  persona 
como  que  consume  drogas  o  que  no  las  consume  con 
probabilidad  .98  y,  para  redutir  la  probabilidad  de  error,  se 
requiere  que  toda  persona  que  solicite  empleo  se  someta  a 
dos  examenes.  Si  los  resultados  de  los  dos  examenes  en  la 
misma  persona  son  eventos  independientes,  ^cuales  son 
las  probabilidades  de  estos  eventos? 

a.  Un  no  consumidor  no  pasa  en  los  dos  examenes. 

b.  Un  consumidor  es  detectado  (es  decir,  el  o  ella  no  pasa 
al  menos  un  examen). 

c.  Un  consumidor  pasa  ambos  examenes. 

4.55  Fondo  monetario  para  donaciones  El  hecho 
de  que  una  propuesta  para  donation  se  financie  con 
frecuencia  depende  de  los  crfticos.  Suponga  que  un  grupo 
de  propuestas  de  investigation  fue  evaluado  por  un  gru¬ 
po  de  expertos  en  cuanto  a  si  las  propuestas  meretian 

ser  financiadas.  Cuando  estas  mismas  propuestas  fueron 
enviadas  a  un  segundo  grupo  independiente  de  expertos,  la 
decision  para  financiar  se  invirtio  en  30%  de  los  casos.  Si 
la  probabilidad  es  .2  de  que  una  propuesta  sea  juzgada  por 
el  primer  grupo  de  asesores  de  revisiones  como  digna  de  ser 
financiada,  ('cuales  son  las  probabilidades  de  estos  eventos? 

a.  Una  propuesta  digna  es  aprobada  por  ambos  grupos. 

b.  Una  propuesta  digna  es  desaprobada  por  ambos  grupos. 

c.  Una  propuesta  digna  es  aprobada  por  un  grupo. 

4.56  Drogadictos  Un  estudio  de  la  conducta  de  un 
gran  numero  de  drogadictos,  despues  de  un  tratamiento 
por  abuso  en  el  consumo  de  drogas,  sugiere  que  la 
probabilidad  de  ser  condenados  en  un  periodo  no  mayor 
a  dos  anos  despues  del  tratamiento,  puede  depender  de  la 
education  del  delincuente.  Las  proporciones  del  numero 
total  de  casos  que  caen  en  cuatro  categories  de  education/ 
condena  se  muestran  en  la  tabla  siguiente. 


Situacion  en  no  mas  de  2 
anos  despues  del  tratamiento 


Educacion 

Condenado 

No  condenado 

Totales 

10  anos  o  mas 

.10 

.30 

.40 

9  anos  o  menos 

.27 

.33 

.60 

Totales 

.37 

.63 

1.00 

Suponga  que  se  selecciona  un  delincuente  del  programa 
de  tratamiento.  Aqui  tenemos  los  eventos  de  interes: 

A:  el  delincuente  tiene  10  anos  o  mas  de  education 

B:  el  delincuente  es  condenado  no  mas  de  dos  anos 
despues  de  terminar  su  tratamiento 

Encuentre  las  probabilidades  apropiadas  para  estos  even¬ 
tos: 

a.  A  b.  B  c .  A  n  B 

d.  A  U  B  e.  Af  f.  (A  U  B)c 

g.  (A  D  B)c  h.  A  dado  que  B  ha  ocurrido. 

i.  B  dado  que  A  ha  ocurrido. 

4.57  Use  las  probabilidades  del  ejercicio  4.56  para 
demostrar  que  estas  igualdades  son  verdaderas: 

a.  P(A  DB)  =  P(A)P(B\A) 

b.  P(A  fl  B)  =  P{B)P(A\B) 

c.  P(A  U  B)  =  P(A)  +  P(B)  -  P(A  fl  B) 

4.58  El  problems  del  cumpleanos  Dos  personas 
entran  a  un  cuarto  y  se  registran  sus  cumpleanos  (caso 
omiso  a  sus  anos). 

a.  Identifique  la  naturaleza  de  los  eventos  simples  en  S. 

b.  (-Cual  es  la  probabilidad  de  que  las  dos  personas  tengan 
un  par  especifico  de  cumpleanos? 

c.  Identifique  los  eventos  simples  en  el  evento  A:  ambas 
personas  tienen  el  mismo  cumpleanos. 

d.  Encuentre  P(A).  e.  Encuentre  P(AL). 

4.59  El  problems  del  cumpleanos,  continua  Si 

n  personas  entran  a  un  cuarto,  encuentre  estas 
probabilidades: 

A:  ninguna  de  las  personas  tienen  el  mismo 
cumpleanos 

B:  al  menos  dos  de  las  personas  tienen  el  mismo 
cumpleanos 

Resuelva  para 

a.  n  =  3  b.  n  =  4 

[nota:  Sorprendentemente,  P(B)  aumenta  con  rapidez 
cuando  n  aumenta.  Por  ejemplo,  para  n  =  20,  P(B)  = 
.411;  para  n  =  40,  P(B)=  .891.] 

4.60  ^Starbucks  o  Peet's®?  Una  estudiante 
universitaria  frecuenta  una  de  las  dos  cafeterias  de  su 
plantel,  escogiendo  Starbucks  70%  de  las  veces  y  Peet’s 
30%  del  tiempo.  En  cualquiera  de  estos  lugares,  ella 
compra  un  cafe  de  moka  en  60%  de  sus  visitas. 

a.  La  siguiente  vez  que  vaya  a  una  cafeteria  en  el  plantel, 
(',cual  es  la  probabilidad  de  que  ella  vaya  a  Starbucks  y 
pida  un  cafe  de  moka? 

b.  7,  Los  dos  eventos  del  inciso  a)  son  independientes? 
Explique. 

c.  Si  ella  entra  en  una  cafeteria  y  pide  un  cafe  de  moka, 
^cual  es  la  probabilidad  de  que  sea  en  Peet’s? 
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d.  ('C’ual  es  la  probabilidad  de  que  ella  vaya  a  Starbucks 
o  pida  un  cafe  de  moka  o  ambas  cosas? 

4.61  Lineas  de  inspection  Cierto  artfculo 
manufacturado  es  inspeccionado  visualmente  por  dos 
inspectores  diferentes.  Cuando  un  artfculo  defectuoso 
pasa  por  la  lfnea  de  production,  la  probabilidad  de  que 
logre  pasar  por  el  primer  inspector  es  .  1 .  De  los  que 
pasan  el  primer  inspector,  el  segundo  inspector  “pierde” 
cinco  de  10.  ^Que  fraction  de  artfculos  defectuosos  logra 
pasar  por  ambos  inspectores? 

4.62  Fumar  y  cancer  Un  estudio  realizado  en 
personas  de  una  region  determinada  mostro  que  20%  de 
ellas  eran  fumadoras.  La  probabilidad  de  muerte  debida 
a  cancer  pulmonar,  dado  que  una  persona  fumaba,  era 
alrededor  de  10  veces  la  probabilidad  de  muerte  debida 
a  cancer  pulmonar  de  una  persona  que  no  fumaba.  Si 

la  probabilidad  de  muerte  debida  a  cancer  pulmonar  en  la 
region  es  .006,  ('  cual  es  la  probabilidad  de  muerte  debida 
a  cancer  pulmonar  dado  que  una  persona  es  fumadora? 

4.63  Detectores  de  humo  Un  sistema  detector 
de  humo  utiliza  dos  aparatos,  A  y  B.  Si  hay  humo,  la 
probabilidad  de  que  este  sea  detectado  por  el  aparato  A  es 
.95;  por  el  aparato  B ,  .98;  y  por  ambos  aparatos,  .94. 

a.  Si  hay  humo,  encuentre  la  probabilidad  de  que  este 
sea  detectado  por  el  aparato  A  o  el  B  o  por  ambos 
aparatos. 

b.  Encuentre  la  probabilidad  de  que  el  humo  no  sea 
detectado. 

4.64  Genetica  de  plantas  Gregor  Mendel  fue  un 
monje  que  sugirio  en  1 865  una  teorfa  de  la  herencia 
basada  en  la  ciencia  de  la  genetica.  El  identified 
individuos  heterocigotos  de  flores  de  color  que  tenfan 
dos  alelos  (un  r  =  alelo  recesivo  de  color  bianco  y 
uno  R  =  alelo  dominante  de  color  rojo).  Cuando 
estos  individuos  se  apareaban,  observo  que  3/4  de  los 
descendientes  tenfan  flores  rojas  y  1/4  tenfan  flores 
blancas.  La  tabla  siguiente  resume  este  apareamiento; 
cada  padre  da  uno  de  sus  alelos  para  formar  el  gen  del 
descendiente. 

Padre  2 

Padre  1  r  R 

r  rr  rR 

R  Rr  RR 

Suponemos  que  es  igualmente  probable  que  cada  padre 
de  cualquiera  de  los  dos  alelos  y  que,  si  uno  de  ellos  o  los 
dos  alelos  de  un  par  es  dominante  (R),  el  descendiente 
tendra  flores  rojas. 

a.  ('Cual  es  la  probabilidad  de  que  un  descendiente  en 
este  apareamiento  tenga  al  menos  un  alelo  dominante? 

b.  ('Cual  es  la  probabilidad  de  que  un  descendiente  tenga 
al  menos  un  alelo  recesivo? 


c.  <,CuaI  es  la  probabilidad  de  que  un  descendiente  tenga 
un  alelo  recesivo,  dado  que  el  descendiente  tiene  flores 
rojas? 

4.65  Lesiones  en  futbol  Durante  la  temporada 
inaugural  de  la  liga  mayor  de  futbol  soccer  en 
Estados  Unidos,  los  equipos  medicos  documentaron 
256  lesiones  que  causaron  la  perdida  de  tiempo 
de  participation  a  jugadores.  Los  resultados  de 
esta  investigation,  publicados  en  The  American 
Journal  of  Sports  Medicine,  se  muestran  en  la  tabla 
siguiente.3 


Severidad 

Practica  (P) 

Juego (G) 

Total 

Menor  (4) 

66 

88 

154 

Moderada  (6) 

23 

44 

67 

Grave  (C) 

12 

23 

35 

Total 

101 

155 

256 

Si  un  individuo  es  sacado  al  azar  de  entre  este  grupo  de 
256  jugadores  de  futbol  soccer,  encuentre  las  siguientes 
probabilidades: 

a.  P(A)  b.  P(G)  c.  P(A  n  G ) 

d.  P(G\A)  e.  P(G\B)  f.  P(G\Q 

g.  P(C\P)  h.  P(B') 

4.66  Escoger  pareja  Es  frecuente  que  hombres 

y  mujeres  no  esten  de  acuerdo  en  que  piensan 
acerca  de  seleccionar  una  pareja.  Suponga  que  una 
encuesta  hecha  a  1000  personas  de  entre  20  y  30  anos 
dio  las  siguientes  respuestas,  a  la  pregunta  de  si  es  mas 
importante  para  su  futura  pareja  ser  capaz  de  comunicar 
sus  sentimientos  (F)  de  lo  que  es  para  esa  persona  vivir 
bien  (G). 

Sentimientos  (F)  Vivir  bien  (G)  Totales 

Hombres  [M)  .35  .20  .55 

Mujeres  (1/1/)  .36  .09  .45 

Totales  .71  .29  1.00 

Si  al  azar  se  selecciona  una  persona  de  entre  este  grupo 
de  1000,  calcule  las  siguientes  probabilidades: 

a.  P(F)  b.  P(G)  c.  P(F\M) 

d.  P(F\W)  e.  P(M\F)  f.  P(W\G) 

4.67  Jason  y  Shac  Las  dos  estrellas  del  equipo 
profesional  de  baloncesto  Miami  Heat  son  muy 
diferentes  cuando  se  trata  de  tiros  fibres.  La  ESPN.com 
informa  que  Jason  Williams  encesta  alrededor 

de  80%  de  sus  tiros  fibres,  en  tanto  que  Shaquille  O’Neal 
encesta  solo  53%  de  sus  tiros  fibres.4  Suponga 
que  los  tiros  fibres  son  independientes  y  que  cada 
jugador  toma  dos  tiros  fibres  durante  un  juego  en 
particular. 

a.  (,CuaI  es  la  probabilidad  de  que  Jason  enceste  sus  dos 
tiros  fibres? 
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b.  ('Cual  es  la  probabilidad  de  que  Shaq  enceste 
exactamente  uno  de  sus  dos  tiros  libres? 

c.  ('Cual  es  la  probabilidad  de  que  Shaq  enceste  sus  dos 
tiros  libres  y  que  Jason  no  enceste  ninguno  de  los 
suyos? 

4.68  Golf  El  jugador  A  ha  entrado  a  un  torneo  de  golf 
pero  no  esta  seguro  si  el  jugador  B  entrant.  El  jugador  A 


tiene  una  probabilidad  de  1/6  de  ganar  el  torneo  si  el 
jugador  B  entra  y  una  probabilidad  de  3/4  de  ganar  si 
el  jugador  B  no  entra  al  torneo.  Si  la  probabilidad  de 
que  el  jugador  B  entre  al  torneo  es  1/3,  encuentre  la 
probabilidad  de  que  el  jugador  A  gane  el  torneo. 


REGLA  DE  BAYES  (OPCIONAL) 


Daltonismo  Reconsideremos  el  experimento  referente  a  daltonismo  visto  en  la  sec- 
cion  4.6.  Observe  que  los  dos  eventos 


B:  la  persona  seleccionada  es  un  hombre 
Bc:  la  persona  seleccionada  es  una  mujer 


tornados  juntos  conforman  el  espacio  muestral  S,  formado  de  hombres  y  mujeres.  Como 
los  daltonicos  pueden  ser  hombres  o  mujeres,  el  evento  A,  que  es  que  una  persona  sea 
daltonica,  esta  formado  de  los  eventos  simples  que  esten  en  A  y  ademas  en  B  y  de  los 
eventos  simples  que  esten  en  A  y  ademas  en  Bc .  Como  estas  dos  intersecciones  son 
mutuamente  excluyentes,  se  puede  escribir  el  evento  A  como 

A  =  (A  n  B)  U  (A  n  Bc ) 


y 

P(A)  =  P(A  C3B)  +  P(A  0  Bc) 
=  .04  +  .002  =  .042 


Suponga  ahora  que  el  espacio  muestral  se  puede  dividir  en  k  subpoblaciones,  .S',,  S2, 
S3, . . . ,  Sh  que,  al  igual  que  en  el  ejemplo  de  daltonismo,  son  mutuamente  excluyentes 
y  exhaustivos;  esto  es,  tornados  juntos  conforman  todo  el  espacio  muestral.  De  un  modo 
semejante,  se  puede  expresar  un  evento  A  como 

a  =  (A  n  5j)  u  (A  n  s2 )  u  (A  n  s3)u  •  •  •  u  (A  n  sk ) 

Entonces 

P(A)  =  P(A  n  sj)  +  p{a  n  s2)  +  P(A  n  s3)  +  ■  ■  ■  +  p(a  n  sk) 

Esto  esta  ilustrado  para  k  =  3  en  la  figura  4.14. 


FIGURA  4. 1  4 

Descomposicion  del 
evento  A 


S 
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Se  puede  avanzar  un  paso  mas  y  usar  la  Regia  de  la  multiplication  para  escribir 
P(A  D  Si)  como  P(Si)P(A\Si),  para  i  =  1,  2, .  .  .  ,  k.  El  resultado  se  conoce  como  la  Ley 

de  probabilidad  total. 


LEY  DE  PROBABILIDAD  TOTAL 

Dado  un  conjunto  de  eventos  Su  S2,  .S\,  .  .  .  ,  Sk  que  son  mutuamente  excluyentes  y 
exhaustivos  y  un  evento  A,  la  probabilidad  del  evento  A  se  puede  expresar  como 

P(A)  =  PiSOPiAlSO  +  P(S2)P(A\S2)  +  P(S3)P(A\S3)  +  ■  •  •  +  P(Sk)P(A\Sk) 


Los  zapatos  tenis  ya  no  son  solo  para  jovenes.  De  hecho,  casi  todos  los  adultos  tienen 
varios  pares  de  ellos.  La  tabla  4.6  da  la  fraction  de  adultos  estadounidenses  de  20  anos 
de  edad  o  mas  que  tienen  cinco  o  mas  pares  de  zapatos  tenis  en  buen  estado,  junto  con  la 
fraction  de  adultos  estadounidenses  de  20  anos  o  mas  en  cada  uno  de  los  cinco  grupos 
de  edad.3  Use  la  Ley  de  probabilidad  total  para  determinar  la  probabilidad  incondicional  de 
un  adulto  de  20  anos  de  edad  o  mas  que  tenga  cinco  o  mas  pares  de  zapatos  tenis  en  buen 
estado. 


tabla  4.6  Tabla  de  probabilidad 


Grupos  y  edades 


G, 

02 

63 

64 

65 

20-24 

25-34 

35-49 

50-64 

>65 

Fraccion  con  >  5  pares 

.26 

.20 

.13 

.18 

.14 

Fraccion  de  adultos  de  20  anos  o  mas 

.09 

.20 

.31 

.23 

.17 

Solucion  Sea  A  el  evento  de  que  una  persona  seleccionada  al  azar  de  entre  la  pobla- 
cion  de  adultos  estadounidenses  de  18  anos  de  edad  y  mas  tenga  cinco  o  mas  pares  de 
zapatos  tenis  en  buen  estado.  Con  Gu  G2, .  . . ,  G5  represente  el  evento  de  que  la  persona 
seleccionada  pertenezca  a  cada  uno  de  los  cinco  grupos  de  edades,  respectivamente. 
Como  los  cinco  grupos  son  exhaustivos,  se  puede  escribir  el  evento  A  como 

a  =  (A  n  g3)  u  (A  n  g2)  u  (a  n  g3)  u  (a  n  g4)  u  (a  n  g5) 

Usando  la  Ley  de  probabilidad  total,  se  puede  hallar  la  probabilidad  de  A  como 

P(A)  =  p(a  n  go  +  P(A  n  g2)  +  P(A  n  g3)  +  p(a  n  g4)  +  P(A  n  g5) 

=  P{G3)P{A\Gi)  +  P(G2)P(A\G2 )  +  P(G3)P(A\G3) 

+  P(G4)P(A\G4)  +  P(G5)P{A\G5 ) 

De  las  probabilidades  de  la  tabla  4.6, 

P(A)  =  (.09)(.26)  +  (.20)(.20)  +  (.31)(.13)  +  (.23)(.18)  +  (.17)(.14) 

=  .0234  +  .0400  +  .0403  +  .0414  +  .0238  =  .1689 


La  probabilidad  incondicional  de  que  una  persona,  seleccionada  de  entre  la  poblacion 
de  adultos  estadounidenses  de  20  anos  de  edad  y  mas,  tenga  al  menos  cinco  pares  de 
zapatos  tenis  en  buen  estado  es  de  alrededor  de  .17.  Observe  que  la  Ley  de  probabilidad 
total  es  un  promedio  ponderado  de  las  probabilidades  dentro  de  cada  grupo,  con  pesos 
.09,  .20,  .31,  .23  y  .17,  que  refleja  los  tamanos  relativos  de  los  grupos. 


Con  frecuencia  es  necesario  hallar  la  probabilidad  incondicional  de  un  evento  B.  dado 
que  un  evento  A  ha  ocurrido.  Una  de  estas  situaciones  ocurre  al  hacer  examenes  de  selec- 
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cion,  que  solfan  estar  asociados  principalmente  con  examenes  medicos  de  diagnostico 
pero  que  ahora  estan  encontrando  aplicaciones  en  varios  campos  de  actividad.  Se  emplea 
equipo  automatico  de  prueba  para  inspeccionar  piezas  en  procesos  de  alto  volumen  de 
production.  Los  examenes  de  esteroides  en  atletas,  los  examenes  caseros  de  embarazo  y 
los  examenes  para  detectar  sida  son  algunas  otras  aplicaciones.  Los  examenes  de  selec¬ 
tion  se  evaluan  sobre  la  probabilidad  de  un  falso  negativo  o  un  falso  positivo  y  estas  dos 
son  probabilidades  condicionales. 

Un  falso  positivo  es  el  evento  de  que  el  examen  sea  positivo  para  una  condition  deter- 
minada,  dado  que  la  persona  no  tiene  la  condition.  Un  falso  negativo  es  el  evento  de 
que  el  examen  sea  negativo  para  una  condition  determinada,  dado  que  la  persona  tiene 
la  condition.  Se  pueden  evaluar  estas  probabilidades  condicionales  usando  una  formula 
derivada  por  el  probabilista  Thomas  Bayes. 

El  experimento  comprende  seleccionar  una  muestra  de  entre  una  de  k  subpoblaciones 
que  sean  mutuamente  excluyentes  y  exhaustivas.  Cada  una  de  estas  subpoblaciones, 
denotada  por  S1;  S2, . .  . ,  Sh  tiene  una  probabilidad  de  selection  P(Si),  P(S2),  P(Sk), .  . . , 
P(Sk),  llamadas  probabilidades  previas.  Se  observa  un  evento  A  en  la  selection.  ^Cual 
es  la  probabilidad  de  que  la  muestra  provino  de  la  subpoblacion  St,  dado  que  A  ha  ocu- 
rrido? 

De  la  section  4.6  se  sabe  que  P(S\A)  =  [  P(A  Pi  .S',)  \/P(A),  que  se  puede  reescribir 
como  P(S,|A)  =  [ PiS,) P(A\S,) \/P(A).  Usando  la  Ley  de  probabilidad  total  para  reescri¬ 
bir  P(A),  tenemos 


W,|ri) 


_ PjSdPjAlSd _ 

PiSJPiAlSJ  +  B(S2)B(A|S2)  +  P(S3)P(A\S3)  +  •  •  •  +  P(SdP(A\Sd 


Es  frecuente  que  estas  nuevas  probabilidades  se  conozcan  como  probabilidades  pos- 
teriores,  es  decir,  probabilidades  de  las  subpoblaciones  (tambien  llamadas  estados  de 
naturaleza)  que  se  han  actualizado  despues  de  observar  la  information  muestral  conte- 
nido  en  el  evento  A.  Bayes  sugirio  que  si  las  probabilidades  previas  son  desconocidas,  se 
pueden  tomar  como  1  Ik,  lo  cual  implica  que  cada  uno  de  los  eventos  .S’,  a  Sk  es  igualmente 
probable. 


REGLA  DE  BAYES 

Con  Si,  S2,  ■  ■  ■ ,  -S',,  representemos  k  subpoblaciones  mutuamente  excluyentes  y  exhaus¬ 
tivas  con  probabilidades  previas  P{Si),  P(S2),  .  .  .  ,  P(Sk).  Si  ocurre  un  evento  A,  la 
probabilidad  posterior  de  5,  dada  A  es  la  probabilidad  conditional 


Xp(S,)P(a\Sj) 

para  i  =  1,2 , ,k. 


p(s;)P(a\S;) 

\A> —  k 


Consulte  el  ejemplo  4.23.  Encuentre  la  probabilidad  de  que  una  persona  selecciona- 
da  tenia  65  anos  de  edad  o  mas,  dado  que  la  persona  tenia  al  menos  cinco  pares  de  zapa- 
tos  tenis  en  buen  estado. 

Solucion  Es  necesario  encontrar  la  probabilidad  condicional  dada  por 


P(G5\A) 


p(a  n  ck) 

P(A) 


Ya  se  ha  calculado  P(A)  =  .1689  usando  la  Ley  de  probabilidad  total.  Por  tanto, 
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P(G5\A)  = 


P(G5)P(A\G5 ) 


P(Gi)P(A\Gi)  +  P(G2)P(A\G2)  +  P(G2)P(A\G2)  +  P(G4P(A\Ga)  +  P(G5)P(A\G5 ) 

= _ (-17X.14) _ 

(.09)(.26)  +  (.20X.20)  +  (.3 1)(.  13)  +  (.23)(.18)  +  (.17)(.14) 


.0238 

.1689 


=  .1409 


En  este  caso,  la  probabilidad  posterior  de  .14  es  un  poco  menor  que  la  probabilidad  pre¬ 
via  de  .17  (de  la  tabla  4.6).  Este  grupo  a  priori  fue  el  segundo  mas  pequeno  y  solo  una 
pequena  proporcion  de  este  segmento  tenia  cinco  o  mas  pares  de  zapatos  tenis  en  buen 
estado. 

^Cual  es  la  probabilidad  posterior  de  quienes  tienen  de  35  a  49  anos  de  edad?  Para 
este  grupo  de  adultos,  tenemos 

P(r  \a  \  = _ (-31X-13) _ = 

'  3|' ’  (.09)(.26)  +  (.20)(.20)  +  (.3 1 )(.  1 3)  +  (.23)(.18)  +  (.17)(.14) 


Esta  probabilidad  posterior  de  .24  es  considerablemente  menor  que  la  probabilidad  pre¬ 
via  de  .31.  En  efecto,  este  grupo  fue  a  priori  el  mayor  segmento  de  la  poblacion  mues- 
treada,  pero,  al  mismo  tiempo,  la  proporcion  de  individuos  de  este  grupo  que  tenia  al 
menos  cinco  pares  de  zapatos  tenis  en  buen  estado  era  la  mas  pequena  de  cualquiera  de 
los  grupos.  Estos  dos  hechos  tornados  juntos  causan  un  ajuste  hacia  abajo  de  casi  un 
tercio  de  la  probabilidad  a  priori  de  .31. 
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EJERCICIQS 


TECNICAS  BASICAS 

4.69  Regia  de  Bayes  Una  muestra  se  selecciona  de  una 
de  dos  poblaciones,  Si  y  S2,  con  probabilidades  P(S,  )  =  .7 
y  P(S2)  =  .3.  Si  la  muestra  se  ha  seleccionado  de  Si,  la 
probabilidad  de  observar  un  evento  A  es  P(A|Si)  =  .2. 

Del  mismo  modo,  si  la  muestra  se  ha  seleccionado  de  S2, 
la  probabilidad  de  observar  A  es  P(A\S2)  =  .3. 

a.  Si  una  muestra  se  selecciona  al  azar  de  una  de  las  dos 
poblaciones,  ^cual  es  la  probabilidad  de  que  ocurra  el 
evento  A? 

b.  Si  la  muestra  se  selecciona  al  azar  y  se  observa  el 
evento  A,  ^cual  es  la  probabilidad  de  que  la  muestra 
sea  seleccionada  de  la  poblacion  Si?  de  la 
poblacion  S2? 

4.70  Regia  de  Bayes  II  Si  se  realiza  un  experimento, 
puede  ocurrir  uno  y  solo  uno  de  los  tres  eventos 
mutuamente  excluyentes  Si,  S2  y  S3,  con  estas 
probabilidades: 

P(Si)  =  .2  P(S2)  =  .5  P(S3)  =  .3 


Las  probabilidades  de  que  ocurra  un  cuarto  evento  A, 
dado  que  ocurre  el  evento  Si,  S2  o  S3,  son 

P(A|Si)  =  .2  P(A|S2)  =  .1  P(A|S3)  =  .3 

Si  se  observa  el  evento  A,  encuentre  IAS,  |A),  P(S2|A)  y 

ns3|A). 

4.71  Ley  de  probabilidad  total  Una  poblacion  se 
puede  dividir  en  dos  subgrupos  que  se  presentan  con 
probabilidades  de  60%  y  40%,  respectivamente.  Un 
evento  A  ocurre  30%  del  tiempo  en  el  primer  subgrupo 
y  50%  del  tiempo  en  el  segundo  subgrupo.  (jCual  es  la 
probabilidad  incondicional  del  evento  A,  cualquiera  que 
sea  el  subgrupo  de  donde  venga? 

APLICACIONES 

4.72  Delincuencia  violenta  Los  registros  de 
delincuencia  urbana  muestran  que  20%  de  todos 

los  delitos  son  violentos  y  que  80%  no  lo  son,  abarcando 
robo,  falsification,  etcetera.  Noventa  por  ciento  de 
los  delitos  violentos  son  denunciados  contra  70% 
de  los  no  violentos. 
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a.  ('Cual  es  el  porcentaje  general  de  denuncias  por  delitos 
urbanos? 

b.  Si  un  delito  esta  ocurriendo  y  es  denunciado  a  la 
policfa,  (:,cual  es  la  probabilidad  de  que  sea  violento? 
,'Ciial  es  la  probabilidad  de  que  no  sea  violento? 

c.  Consulte  el  inciso  b).  Si  un  crimen  que  este 
ocurriendo  se  denuncia  a  la  policfa,  ^por  que  es  mas 
probable  que  no  sea  violento?  ^No  serfa  mas  probable 
que  los  delitos  violentos  se  denunciaran?  ^Puede 
usted  explicar  estos  resultados? 

4.73  Error  de  un  trabajador  Una  maquina  operada 
por  un  trabajador  produce  un  artfculo  defectuoso  con 
probabilidad  .01  si  el  trabajador  sigue  exactamente 

las  instrucciones  de  operation  de  la  maquina  y 
con  probabilidad  .03  si  no  las  sigue.  Si  el  sigue  las 
instrucciones  90%  del  tiempo,  ('l]uc  proporcion  de 
todos  los  artfculos  producidos  por  la  maquina  sera 
defectuosa? 

4.74  Seguridad  en  un  aeropuerto  Suponga  que, 
en  una  ciudad  en  particular,  el  aeropuerto  A  maneja 
50%  de  todo  el  trafico  aereo  y  los  aeropuertos  By  C 
manejan  30%  y  20%,  respectivamente.  Los  porcentajes 
de  deteccion  de  armas  en  los  tres  aeropuertos  son  .9,  .8 
y  .85,  respectivamente.  Si  se  encuentra  un  pasajero  en 
uno  de  los  aeropuertos  llevando  un  arma  por  la  puerta  de 
abordar,  ^cual  es  la  probabilidad  de  que  el  pasajero  este 
usando  el  aeropuerto  A?  i  Y  el  aeropuerto  C? 

4.75  Estrategias  en  futbol  Se  sabe  que  un  equipo 
particular  de  futbol  corre  30%  de  sus  jugadas  a  la 
izquierda  y  70%  a  la  derecha.  El  apoyador  de  un  equipo 
contrario  observa  que  el  defensa  derecho  cambia  su 
posicion  casi  todo  el  tiempo  (80%)  cuando  juega  a  la 
derecha  y  que  sigue  una  posicion  balanceada  el  resto  del 
tiempo.  Cuando  juega  a  la  izquierda,  el  defensa  toma 
una  posicion  balanceada  90%  del  tiempo  y  la  posicion 
de  cambio  el  restante  10%.  En  una  jugada  particular, 

el  apoyador  observa  que  el  defensa  toma  una  posicion 
balanceada. 

a.  ^Cual  es  la  probabilidad  de  que  la  jugada  sea  a  la 
izquierda? 

b.  ^Cual  es  la  probabilidad  de  que  la  jugada  sea  a  la 
derecha? 

c.  Si  usted  fuera  el  apoyador,  ('C|ue  direction  prepararfa 
para  defender  si  vio  la  posicion  balanceada? 

4.76  IMo  pasas,  no  juegas  Muchas  escuelas 
publicas  estan  poniendo  en  practica  una  regia  de  “no 
pasas,  no  juegas”  para  atletas.  En  este  sistema,  un 
estudiante  que  no  apruebe  un  curso  es  descalificado 
para  participar  en  actividades  extracurriculares  durante 
el  siguiente  periodo  de  calificacion.  Suponga  que  hay 
una  probabilidad  de  .15  de  que  un  atleta,  que 


previamente  no  ha  sido  descalificado,  sea  descalificado; 
la  probabilidad  de  que  un  atleta  descalificado  vuelva 
a  ser  descalificado  en  el  siguiente  periodo  es  de  .5. 

Si  30%  de  los  atletas  han  sido  descalificados  antes, 

(:,cual  es  la  probabilidad  incondicional  de  que  un  atleta 
sea  descalificado  durante  el  siguiente  periodo  de 
calificacion? 

4.77  Diagnostico  medico  Las  historias  de  casos 
clmicos  indican  que  diferentes  enfermedades  pueden 
producir  smtomas  identicos.  Suponga  que  un  conjunto 
particular  de  smtomas,  que  se  denotaran  como  evento 
H,  se  presenta  solo  cuando  se  presenta  cualquiera  de 
tres  enfermedades,  A,  B  o  C.  (Para  mayor  simplicidad, 
supondremos  que  las  enfermedades  A,  B  y  C  son 
mutuamente  excluyentes.)  Estudios  realizados  demuestran 
estas  probabilidades  de  adquirir  las  tres  enfermedades: 

P(A)  =  .01 
P(B)  =  .005 
P(Q  =  .02 

Las  probabilidades  de  desarrollar  los  smtomas  H,  dada 
una  enfermedad  especffica,  son 
P(H\A)  =  .90 
P(H\B)  =  .95 
P(H\Q  =  .75 

Suponiendo  que  una  persona  enferma  presente  los 
smtomas  H,  cual  es  la  probabilidad  de  que  la  persona 
tenga  la  enfermedad  A? 

4.78  iEnganar  en  sus  impuestos?  Suponga  que 
5%  de  todas  las  personas  que  presentan  el  largo  formato 
de  pago  de  impuestos  busca  deducciones  que  se  sabe  son 
ilegales,  y  otro  2%  incorrectamente  anota  deducciones 
porque  no  estan  familiarizados  con  los  reglamentos 

de  impuesto  al  ingreso.  Del  5%  que  son  culpables  de 
enganar,  80%  negaran  saber  del  error  si  se  confrontan  a  un 
investigador.  Si  quien  presenta  el  largo  formato  se  confronta 
a  una  deduction  no  justificada  y  niega  saber  del  error,  ^cual 
es  la  probabilidad  de  que  sea  declarada  culpable? 

4.79  Examenes  de  selection  Suponga  que  cierta 
enfermedad  esta  presente  en  10%  de  la  poblacion,  y  que 
hay  un  examen  de  selection  disenado  para  detectar  si 
esta  enfermedad  esta  presente.  El  examen  no  siempre 
funciona  a  la  perfection.  A  veces,  es  negativo  cuando  la 
enfermedad  esta  presente  y  otras  es  positivo  en  ausencia 
de  ella.  La  tabla  siguiente  muestra  la  proporcion  de 
tiempos  en  que  el  examen  produce  varios  resultados. 


Examen  es  positivo  ( P) 

Examen  es  negativo  (A/) 

Enfermedad 
presente  (D) 

.08 

.22 

Enfermedad 
ausente  (D°) 

.05 

.85 
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a.  Encuentre  las  siguientes  probabilidades  de  la  tabla: 
P(D),  P(DC),  P(N\DC),  P(N\D). 


d.  Encuentre  la  probabilidad  de  un  falso  positivo,  que 
el  examen  sea  positivo,  dado  que  la  persona  no  tiene 
enfermedad. 


b.  Use  la  Regia  de  Bayes  y  los  resultados  del  inciso  a) 
para  hallar  P(D\N). 


e.  Encuentre  la  probabilidad  de  un  falso  negativo,  que 
el  examen  sea  negativo,  dado  que  la  persona  tiene  la 
enfermedad. 


c.  Use  la  definicion  de  probabilidad  condicional  para 
hallar  P(D\N).  (Su  respuesta  debe  ser  igual  a  la 
respuesta  del  inciso  b).) 


f.  Cualquiera  de  las  probabilidades  de  los  incisos  d)  o  e) 
(:,son  suficientemente  grandes  como  para  preocuparnos 
por  la  confiabilidad  de  este  metodo  de  seleccion? 
Explique. 


VARIABLES  ALEATORIAS  DISCRETAS  Y 
SUS  DISTRIBUCIONES  DE  PROBABILIDAD 


En  el  capitulo  1 ,  las  variables  se  definieron  como  caracteristicas  que  cambian  o  varfan 
con  el  tiempo  y/o  para  diferentes  personas  u  objetos  bajo  consideration.  Las  variables 
cuantitativas  generan  datos  numericos,  en  tanto  que  las  variables  cualitativas  generan 
datos  categoricos.  No  obstante,  incluso  las  variables  cualitativas  pueden  general-  datos 
numericos  si  las  categories  son  codificadas  numericamente  para  formar  una  escala.  Por 
ejemplo,  si  se  lanza  al  aire  una  sola  moneda,  el  resultado  cualitativo  podria  registrarse 
como  “0”  si  es  cara  o  como  “1”  si  es  cruz. 

Variables  aleatorias 

Una  variable  x  valuada  numericamente  varia  o  cambia,  dependiendo  del  resultado  par¬ 
ticular  del  experimento  que  se  mida.  Por  ejemplo,  suponga  que  se  tira  un  dado  y  se  mide 
x,  el  numero  observado  en  la  cara  superior.  La  variable  x  puede  tomar  cualquiera  de  seis 
valores:  1,  2,  3,  4,  5,  6,  dependiendo  del  resultado  aleatorio  del  experimento.  Por  esta 
razon,  la  variable  x  se  conoce  como  variable  aleatoria. 


Definicion  Una  variable  x  es  variable  aleatoria  si  el  valor  que  toma,  correspon- 
diente  al  resultado  de  un  experimento,  es  una  probabilidad  o  evento  aleatorio. 


Se  pueden  considerar  numerosos  ejemplos  de  variables  aleatorias: 

•  x  =  Numero  de  defectos  en  una  pieza  de  mueble  seleccionada  al  azar 

•  x  =  Calificacion  de  examen  de  aptitud  escolar  (SAT)  para  un  solicitando  univer- 
sitario  seleccionado  al  azar 

•  x  =  Numero  de  llamadas  telefonicas  recibidas  por  una  linea  directa  de  interven¬ 
tion  en  crisis  durante  un  periodo  seleccionado  al  azar 

Al  igual  que  en  el  capitulo  1,  las  variables  aleatorias  cuantitativas  se  clasifican  ya  sea  co¬ 
mo  discretas  o  como  continuas,  de  acuerdo  con  los  valores  que  x  pueda  tomar.  Es  impor- 
tante  distinguir  entre  variables  aleatorias  discretas  y  continuas,  porque  se  usan  tecnicas  dife¬ 
rentes  para  describir  sus  distribuciones.  Nos  concentramos  en  variables  aleatorias  discretas 
en  el  resto  de  este  capitulo;  las  variables  aleatorias  continuas  son  el  tema  del  capitulo  6. 

Distribuciones  de  probabilidad 

En  los  capitulos  1  y  2,  usted  aprendio  a  construir  la  distribucion  de  frecuencia  relativa 
para  un  conjunto  de  mediciones  numericas  en  una  variable  x.  La  distribucion  dio  esta 
information  acerca  de  x: 


www.FreeLibros.me 


164  O  CAPITULO  4  PROBABILIDAD  Y  DISTRIBUCIONES  DE  PROBABILIDAD 


•  (-  Que  valores  de  x  se  presentaron? 

•  i Con  que  frecuencia  se  presento  cada  valor  de  x! 

Usted  tambien  aprendio  a  usar  la  media  y  desviacion  estandar  para  medir  el  centra  y 
variabilidad  de  este  conjunto  de  datos. 

En  este  capitulo,  definimos  la  probabilidad  como  el  valor  limitando  de  la  frecuencia 
relativa  cuando  el  experimento  se  repite  una  y  otra  vez.  Ahora  definimos  la  distribucion 
de  probabilidad  para  una  variable  aleatoria  x  como  la  distribucion  de  frecuencia  rela¬ 
tiva  construida  para  toda  la  poblacion  de  mediciones. 


Definicion  La  distribucion  de  probabilidad  para  una  variable  aleatoria  discreta 
es  una  formula,  tabla  o  grafica  que  da  los  posibles  valores  de  x,  y  la  probabilidad  p(x) 
asociada  con  cada  valor  de  x. 


Los  valores  de  x  representan  eventos  numericos  mutuamente  excluyentes.  Sumar  p(x) 
sobre  todos  los  valores  de  x  es  equivalente  a  sumar  las  probabilidades  de  todos  los  even¬ 
tos  simples  y  por  tanto  es  igual  a  1 . 


REQUISITOS  PARA  UNA  DISTRIBUCION 
DE  PROBABILIDAD  DISCRETA 

•  0  <  p(x)  <  1 

•  2  p(x)  =  1 


Lance  al  aire  dos  monedas  imparciales  y  sea  x  igual  al  numero  observado  de  caras. 
Encuentre  la  distribucion  de  probabilidad  para  x. 

Solucion  Los  eventos  simples  para  este  experimento  con  sus  respectivas  probabi¬ 
lidades  se  muestran  en  la  tabla  4.7.  Como  Ex  =  HH  resulta  en  dos  caras,  este  evento 
simple  resulta  en  el  valor  x  =  2.  Del  mismo  modo,  el  valor  x  =  1  se  asigna  a  E2,  y  asf 
sucesivamente. 


tabla  4.7  Eventos  simples  y  probabilidades  al  lanzar  al  aire  dos  monedas 

Evento 

simple  Moneda  1  Moneda  2  P(^)  x 

F,  H  H  1/4  2 

F2  H  T  1/4  1 

E3  T  H  1/4  1 

£,  T  T  1/4  0 


Para  cada  valor  de  x,  se  puede  calcular  p(x)  al  sumar  las  probabilidades  de  los  eventos 
simples  en  ese  evento.  Por  ejemplo,  cuando  x  =  0, 

Pi  0)  =  P(Ed  =  \ 

y  cuando  x  =  1, 

p(  1)  =  P(E2)  +  P(E3)  =  i 
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TABLA  4.8 


FIGURA  4. 1  5 

Histograma  de 
probabilidad  para  el 
ejemplo  4.25 


Los  valores  de  x  y  sus  probabilidades  respectivas,  p(x),  aparecen  en  la  tabla  4.8.  Observe 
que  las  probabilidades  totalizan  1 . 


Distribucion  de  probabilidad  para  x  (x  =  numero  de  caras) 

Eventos  simples 
x  en  x  p[x) 

0  f4  1/4 

1  E2.  E3  1/2 

2  £j _ 1/4_ 

2  p(x)  =  1 


La  distribucion  de  probabilidad  de  la  tabla  4.8  se  puede  graficar  usando  los  metodos 
de  la  seccion  1 .5  para  formar  el  histograma  de  probabilidad  en  la  figura  4. 1 5 . 1  Los  tres 
valores  de  la  variable  aleatoria  x  se  encuentran  en  el  eje  horizontal,  y  las  probabilida¬ 
des  p(x)  estan  en  el  eje  vertical  (sustituyendo  a  las  frecuencias  relativas  empleadas  en  el 
capltulo  1).  Como  el  ancho  de  cada  barra  es  1,  el  area  bajo  la  barra  es  la  probabilidad  de 
observar  el  valor  particular  de  x  y  el  area  total  es  igual  a  1 . 


m 


APPLET 

Hay  dos  applets  de  Java  que  permiten  al  usuario  aproximar  las  distribuciones  de  pro¬ 
babilidad  discreta  usando  metodos  de  simulation.  Esto  es,  aun  cuando  las  probabili¬ 
dades  p(x)  solo  se  pueden  hallar  como  las  frecuencias  relativas  a  largo  plazo,  cuando 
el  experimento  se  repite  un  numero  infinito  de  veces,  podemos  acercarnos  a  estas 
probabilidades  si  repetimos  el  experimento  un  gran  numero  de  veces.  Los  applets 
denominados  Flipping  Fair  Coins  (Lanzamiento  de  monedas  justas)  y  Flipping 
Weighted  Coins  (Lanzamiento  de  monedas  no  justas)  son  dos  de  estas  simulacio- 
nes.  La  forma  mas  rapida  de  generar  la  distribucion  aproximada  de  probabilidad  para 
x,  el  numero  de  caras  en  n  tiros  de  la  moneda,  es  repetir  el  experimento  “100  a  la  vez”, 
usando  el  boton 


100  3\  a  Time 


de  la  parte  inferior  del  applet.  La  distribucion  de  probabi¬ 
lidad  aumentara  en  forma  mas  bien  rapida.  Se  pueden  aproximar  los  valores  de  p(x)  y 
comparar  contra  los  valores  reales  calculados  usando  reglas  de  probabilidad.  Usare- 
mos  estos  applets  para  los  ejercicios  Mi  Applet  al  final  del  capltulo. 


'La  distribucion  de  probabilidad  de  la  tabla  4.8  tambien  se  puede  presentar  usando  una  formula,  que  se  da  en  la 
seccion  5.2. 
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FIGURA  4. 1  6 

Applet  Flipping  Fair 
Coins 

(Lanzamiento  de  monedas 
justas) 


FIGURA  4. 1  7 

Applet  Flipping 
Weighted  Coins 

(Lanzamiento  de  monedas 
no justas) 


Sample  Size  =  3 


0A  n  =  2000 

0.3 


0.2 

0.1 

0.0 


0  12  3 

Number  of  Heads 


10  at  a  Tim 


J 


100  at  a  Ti 


Sample  Size  =  3 

01100211  120011  100200 
1022  1  031021001311011 
11212012101021  100011 
1110  1  110011102111122 
1001  1  211022201011202 


0.5 


N  =  770 


0.4 

0.3 

0.2 


0.1 

0.0 


0  12  3 

Number  of  Heads 


100  at  a  Tin 


J 


La  media  y  desviacion  estandar  para 
una  variable  aleatoria  discreta 

La  distribucion  de  probabilidad  para  una  variable  aleatoria  discreta  luce  muy  semejante 
a  la  distribucion  de  frecuencia  relativa  vista  en  el  capitulo  1.  La  diferencia  es  que  la 
distribucion  de  frecuencia  relativa  describe  una  muestra  de  n  mediciones,  en  tanto  que 
la  distribucion  de  probabilidad  se  construye  como  un  modelo  para  toda  la  poblacion  de 
mediciones.  Asi  como  la  media  x  y  la  desviacion  estandar  s  midieron  el  centro  y  disper¬ 
sion  de  los  datos  muestrales,  usted  puede  calcular  medidas  similares  para  describir  el 
centro  y  dispersion  de  la  poblacion. 

La  media  poblacional,  que  mide  el  valor  promedio  de  x  en  la  poblacion,  tambien  se 
denomina  valor  esperado  de  la  variable  aleatoria  x.  Es  el  valor  que  se  esperaria  obser- 
var  en  promedio  si  el  experimento  se  repite  una  y  otra  vez.  La  formula  para  calcular  la 
media  poblacional  es  mas  facil  de  entender  por  ejemplo.  Lance  otra  vez  al  aire  esas  dos 
monedas  imparciales,  y  sea  x  el  numero  de  caras  observado.  Construimos  esta  distribu¬ 
cion  de  probabilidad  para  x: 


X 

0  1 

2 

p(x) 

1/4  1/2 

1/4 
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Suponga  que  el  experimento  se  repite  un  gran  numero  de  veces,  por  ejemplo  n  = 
4000000  de  veces.  Intuitivamente,  se  esperarfa  observar  alrededor  de  un  millon  de 
ceros,  dos  millones  de  numeros  1  y  un  millon  de  numeros  dos.  Entonces  el  valor  prome- 
dio  de  x  serfa  igual  a 

Suma  de  mediciones  _  1000000(0)  +  2000000(1)  +  1000000(2) 

»  “  4000000 


Observe  que  el  primer  termino  de  esta  suma  es  (0)p(0),  el  segundo  es  igual  a  ( I  )p(  I )  y 
el  tercero  es  (2)p(2).  El  valor  promedio  de  x,  entonces,  es 

Xxp(x)  =  0  +  ~  +  ~  =  1 

Este  resultado  da  alguna  justiiicacion  intuitiva  para  la  definicion  del  valor  esperado  de 
una  variable  aleatoria  x  discreta. 


Definicion  Sea  x  una  variable  aleatoria  discreta  con  distribucion  de  probabilidad 
p(x).  La  media  o  valor  esperado  de  x  esta  dada  como 

/U,  =  E(x)  =  X  xp(x) 

donde  los  elementos  se  suman  sobre  todos  los  valores  de  la  variable  aleatoria  x. 


Podrfamos  usar  un  argumento  similar  para  justificar  las  formulas  para  la  varianza 
poblacional  a2  y  la  desviacion  estandar  de  la  poblacion  a.  Estas  medidas  numericas 
describen  la  dispersion  o  variabilidad  de  la  variable  aleatoria  usando  el  “promedio”  o 
“valor  esperado”  del  cuadrado  de  las  desviaciones  de  los  valores  x  desde  su  media  p.. 


Definicion  Sea  x  una  variable  aleatoria  discreta  con  distribucion  de  probabilidad 
p(x)  y  media  p..  La  varianza  de  jc  es 

a2  =  E[(x  -  /x)2]  =  S(x  -  p.fp(x) 

donde  la  sumatoria  es  sobre  todos  los  valores  de  la  variable  aleatoria  x. 1 


Definicion  La  desviacion  estandar  <r  de  una  variable  aleatoria  v  es  igual  a  la  ratz 
cuadrada  positiva  de  su  varianza. 


Una  tienda  de  electronica  vende  un  modelo  particular  de  computadora  portatil.  Hay  solo 
cuatro  computadoras  en  existencia  y  la  gerente  se  pregunta  cual  sera  la  demanda  de  hoy 
para  este  modelo  particular.  Ella  se  entera  en  el  departamento  de  marketing  de  que  la 
distribucion  de  probabilidad  para  x,  la  demanda  diaria  para  la  laptop,  es  como  se  muestra 


'  Se  puede  demostrar  (prueba  omitida)  que  (E  =  S(.r  —  /p2p(x)  =  %x2p(x)  —  fJL1.  Este  resultado  es  analogo  a  la 
formula  de  computacion  para  la  suma  de  cuadrados  de  las  desviaciones  dadas  en  el  capitulo  2. 
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TABLA  4.9 


FIGURA  4. 1  8 

Distribucion  de  proba- 
bilidad  para  el 
ejemplo  4.26 


en  la  tabla.  Encuentre  la  media,  varianza  y  desviacion  estandar  de  x.  ^Es  probable  que 
cinco  o  mas  clientes  deseen  comprar  una  laptop  hoy? 


X 

0  1 

2 

3 

4 

5 

PM 

.10  .40 

.20 

.15 

.10 

.05 

Solucion  La  tabla  4.9  muestra  los  valores  de  x  y  p(x),  junto  con  los  terminos  indi- 
viduales  empleados  en  las  formulas  para  /x  y  cr2.  La  suma  de  los  valores  en  la  tercera 
columna  es 

fx  =  X  xp(x)  =  (0)(.10)  +  (1)(.40)  +  •  •  •  +  (5)(.05)  =  1.90 
en  tanto  que  la  suma  de  los  valores  en  la  quinta  columna  es 
cr2  =  1(x  -  ixyp(x) 

=  (0  -  1  -9)2(.  10)  +  (1  -  1.9)z(.40)  +  •  •  •  +  (5  -  1.9)2(.05)  =  1.79 

y 

a=  Vcr2  =  vT/79  =  1.34 

Calculos  para  el  ejemplo  4.26 


X 

pix) 

xp(x) 

(x  -  pf 

(x  -  /x)2  p[x) 

0 

.10 

.00 

3.61 

.361 

i 

.40 

.40 

.81 

.324 

2 

.20 

.40 

.01 

.002 

3 

.15 

.45 

1.21 

.1815 

4 

.10 

.40 

4.41 

.441 

5 

.05 

.25 

9.61 

.4805 

Totales  1.00 

/x  =  1.90 

cr2  =  1.79 

La  grafica  de  la  distribucion  de  probabilidad  se  muestra  en  la  figura  4.18.  Como  la  dis¬ 
tribucion  tiene  mas  o  menos  la  forma  de  montfculo,  aproximadamente  95%  de  todas  las 
mediciones  deben  estar  a  no  mas  de  dos  desviaciones  estandar  de  la  media,  es  decir, 

fx  ±  2o-=>  1.90  ±  2(1.34)  o  -,78a4.58 

Como  x  =  5  esta  fuera  de  este  intervalo,  se  puede  decir  que  es  improbable  que  cinco  o 
mas  clientes  deseen  comprar  una  laptop  hoy.  De  hecho,  P(x  >  5)  es  exactamente  .05, 
o  sea  1  vez  en  20. 
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En  una  loterfa  realizada  a  beneficio  de  una  institution  local  de  caridad,  se  han  de  vender 
8000  boletos  a  $10  cada  uno.  El  premio  es  un  automovil  de  $24000.  Si  usted  compra  dos 
boletos,  Belial  es  su  ganancia  esperada? 

Solucion  Su  ganancia  x  puede  tomar  uno  de  dos  valores.  O  bien  perdera  $20  (es 
decir,  su  “ganancia”  sera  — $20)  o  ganara  $23980,  con  probabilidades  de  7998/8000  y 
2/8000,  respectivamente.  La  distribucion  de  probabilidad  para  la  ganancia  x  se  muestra 
en  la  tabla: 

x_ p(x) 

— $20  7998/8000 

$23980  2/8000 

La  ganancia  esperada  sera 

fi  =  X  xp(x) 


Recuerde  que  el  valor  esperado  de  x  es  el  promedio  de  la  poblacion  teorica  que  resultarfa 
si  la  loterfa  se  repitiera  un  numero  infinitamente  grande  de  veces.  Si  se  hiciera  esto,  su 
ganancia  promedio  o  esperada  por  boleto  de  loterfa  serfa  una  perdida  de  $14. 


Determine  la  prima  anual  para  una  poliza  de  seguro  de  $10000  que  cubre  un  evento 
que,  en  un  largo  tiempo,  ha  ocurrido  a  razon  de  2  veces  en  100.  Sea  x  igual  a  la  ganancia 
financiera  anual  para  la  compama  de  seguros,  que  resulte  de  la  venta  de  la  poliza,  y  sea 
C  igual  a  la  prima  anual  desconocida.  Calcule  el  valor  de  C  tal  que  la  ganancia  esperada 
E(x)  iguale  a  cero.  Entonces  C  es  la  prima  requerida  para  que  haya  punto  de  equilibrio. 
Para  esto,  la  compama  sumarfa  costos  administrativos  y  utilidad. 

Solucion  El  primer  paso  en  la  solucion  es  determinar  los  valores  que  la  ganancia  x 
puede  tomar  y  luego  determinar  p{x).  Si  el  evento  no  ocurre  durante  el  ano,  la  compama 
de  seguros  ganara  la  prima  de  x  =  C  dolares.  Si  el  evento  ocurre,  la  ganancia  sera  nega- 
tiva;  esto  es,  la  compama  perdera  $10000  menos  la  prima  de  C  dolares  ya  recolectada. 
Entonces  x  =  —(10000  —  C)  dolares.  Las  probabilidades  asociadas  con  estos  dos  valo¬ 
res  de  x  son  98/100  y  2/100,  respectivamente.  La  distribucion  de  probabilidad  para  la 
ganancia  se  muestra  en  la  tabla: 

x=  Ganancia  p(x) 

C  98/100 

—(10000  —  C)  2/100 

Como  la  companla  desea  una  prima  de  seguro  C  tal  que,  a  largo  plazo  (para  muchas  poli- 
zas  similares),  la  ganancia  media  sea  igual  a  cero,  se  puede  establecer  el  valor  esperado 
de  x  igual  a  cero  y  despejar  C.  Entonces 

jjt  =  E(x)  =  %xp(x) 


o 


Despejando  C  de  esta  ecuacion,  se  obtiene  C  =  $200.  Por  tanto,  si  la  compama  de 
seguros  cobro  una  prima  anual  de  $200,  el  promedio  de  ganancia  calculada  para  un  gran 


www.FreeLibros.me 


170  O  CAPITULO  4  PROBABILIDAD  Y  DISTRIBUCIONES  DE  PROBABILIDAD 

numero  de  polizas  similares  seria  igual  a  cero.  La  prima  real  serfa  igual  a  $200  mas  cos- 
tos  administrativos  y  utilidad. 


El  metodo  para  calcular  el  valor  esperado  de  x  para  una  variable  aleatoria  continua 
es  similar  a  lo  que  acabamos  de  hacer,  pero  en  la  practica  requiere  el  uso  de  calculo.  No 
obstante,  los  resultados  basicos  respecto  a  expectativas  son  los  mismos  para  variables 
aleatorias  continuas  y  discretas.  Por  ejemplo,  sin  considerar  si  x  es  continua  o  discreta, 
lx  =  E(x)  y  a2  =  E[{x  —  pf\. 


EJERCICIOS 


TECNICAS  BASICAS 

4.80  /Discretas  o  continuas?  Identifique  las 

siguientes  variables  aleatorias  como  discretas  o  continuas: 

a.  El  numero  total  de  puntos  anotados  en  un  juego  de 
futbol. 

b.  La  duration  en  estante  de  un  medicamento  particular. 

c.  La  altura  de  la  marea  del  oceano  en  un  lugar  determinado. 

d.  Longitud  de  una  perca  americana  de  2  anos  de  edad. 

e.  El  numero  de  choques  de  aviones  en  el  aire  que  casi 
ocurren  en  un  ano. 

4.81  /Discretas  o  continuas?  II  Identifique  las 

siguientes  variables  aleatorias  como  discretas  o  continuas: 

a.  Aumento  en  tiempo  de  vida  alcanzado  por  un  paciente 
de  cancer  como  resultado  de  una  cirugfa. 

b.  Resistencia  a  la  ruptura  (en  libras  por  pulgada  cuadrada) 
de  un  cable  de  acero  de  una  pulgada  de  diametro. 

c.  Numero  de  venados  muertos  por  ano  en  una 
reservation  estatal  de  fauna  silvestre. 

d.  Numero  de  cuentas  vencidas  en  una  tienda  de 
departamentos  en  un  tiempo  particular. 

e.  Su  presion  sangumea. 

4.82  Distribucion  de  probabilidad  I  Una  variable 

aleatoria  x  tiene  esta  distribucion  de  probabilidad: 


X 

0  1  2  3  4  5 

p(x) 

.1  .3  .4  .1  ?  .05 

a.  Encuentre  p( 4). 

b.  Construya  un  histograma  de  probabilidad  para 
describir  p(x). 

c.  Encuentre  p,  cr  y  cr. 

d.  Localice  el  intervalo  p  ±  2cr  en  el  eje  x  del 
histograma.  /Cual  es  la  probabilidad  de  que  x  caiga 
en  este  intervalo? 

e.  Si  fueramos  a  seleccionar  un  numero  muy  grande  de 
valores  de  x  de  la  poblacion,  /  casi  todos  caerfan  en  el 
intervalo  /x  ±  2cr?  Explique. 


4.83  Distribucion  de  probabilidad  II  Una  variable 
aleatoria  x  puede  tomar  cinco  valores:  0,  1,2,  3,  4. 

Una  parte  de  la  distribucion  de  probabilidad  se  muestra 
aquf: 


X 

0  12  3  4 

pM 

.1  .3  .3  ?  .1 

a.  Encuentre  p{ 3). 

b.  Construya  un  histograma  de  probabilidad  para  p(x). 

c.  Calcule  la  media  poblacional,  varianza  y  desviacion 
estandar. 

d.  /Cual  es  la  probabilidad  de  que  x  sea  mayor  a  2? 

e.  /Cual  es  la  probabilidad  de  que  x  sea  3  o  menor? 

4.84  Dados  Sea  x  igual  al  numero  observado  en  el  tiro 
de  un  solo  dado  balanceado. 

a.  Encuentre  y  grafique  la  distribucion  de  probabilidad 
para  x. 

b.  /Cual  es  el  promedio  o  valor  esperado  de  x? 

c.  /Cual  es  la  desviacion  estandar  de  x? 

d.  Localice  el  intervalo  p  ±  2cr  en  el  eje  x  de  la 
grafica  del  inciso  a).  /Que  proporcion  de  todas  las 
mediciones  caerfan  en  este  intervalo? 

4.85  Visitas  de  tienda  Con  x  represente  el  numero 
de  veces  que  un  cliente  va  a  una  tienda  en  un  periodo  de 
una  semana.  Suponga  que  esta  es  la  distribucion  de 
probabilidad  de  x: 


X 

0  1 

2  3 

pM 

.1  .4 

.4  .1 

Encuentre  el  valor  esperado  de  x,  el  numero  promedio  de 
veces  que  un  cliente  va  a  la  tienda. 

APLICACIONES 

4.86  /Letterman  o  Leno?  /Quien  es  el  rey  de  las 
horas  ya  tarde  en  la  noche  en  la  television?  Un  estudio 
por  internet  estima  que,  cuando  hay  option  entre  David 
Letterman  y  Jay  Leno,  52%  de  la  poblacion  prefiere 
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ver  a  Jay  Leno.  Suponga  que  al  azar  seleccionamos 
tres  televidentes  noctambulos  y  les  preguntamos  a  cual 
presentador  prefiere. 

a.  Encuentre  la  distribucion  de  probabilidad  para  x, 
el  numero  de  personas  de  la  muestra  de  tres  que 
preferirfan  a  Jay  Leno. 

b.  Construya  el  histograma  de  probabilidad  para  p(x). 

c.  ('Cual  es  la  probabilidad  de  que  exactamente  uno  de 
los  tres  prefiera  a  Jay  Leno? 

d.  7,  Cuales  son  la  media  poblacional  y  desviacion 
estandar  para  la  variable  aleatoria  x? 

4.87  <iCual  Nave  es?  Un  llavero  contiene  cuatro 
llaves  de  oficina  que  son  identicas  en  apariencia,  pero 
solo  una  abrira  la  puerta  de  su  oficina.  Suponga  que  al 
azar  selecciona  una  Have  y  prueba  con  ella.  Si  no  es  la 
buena,  al  azar  selecciona  una  de  las  tres  llaves  restantes. 
Si  tampoco  es  la  buena,  al  azar  selecciona  una  de  las  dos 
ultimas.  Cada  secuencia  diferente  que  pueda  ocurrir  al 
seleccionar  las  llaves  representa  uno  de  un  conjunto  de 
eventos  simples  igualmente  probables. 

a.  Haga  una  lista  de  los  eventos  simples  en  S  y  asigne 
probabilidades  a  los  eventos  simples. 

b.  Sea  x  igual  al  numero  de  llaves  con  las  que  se  intenta 
antes  de  hallar  la  que  abre  la  puerta  (x  =  1,  2,  3,  4). 

A  continuation  asigne  el  valor  apropiado  de  x  a  cada 
evento  simple. 

c.  Calcule  los  valores  de  p(x)  y  presentelos  en  una  tabla. 

d.  Construya  un  histograma  de  probabilidad  para  p{x). 

4.88  luleta  El  ejercicio  4.10  describio  el  juego  de 
la  ruleta.  Supongamos  que  listed  apuesta  $5  en  un  solo 
numero,  por  ejemplo  el  18.  El  pago  en  este  tipo  de 
apuesta  es  por  lo  general  35  a  1 .  ('  Cual  es  su  ganancia 
esperada? 

4.89  ^Sesgo  en  genero?  Una  comparna  tiene  cinco 
solicitantes  para  dos  puestos  de  trabajo:  dos  mujeres  y 
tres  hombres.  Suponga  que  los  cinco  solicitantes 

son  igualmente  calificados  y  que  no  hay  preferencia 
para  escoger  su  genero.  Sea  x  igual  al  numero  de  mujeres 
escogidas  para  ocupar  los  dos  puestos  de  trabajo. 

a.  Encuentre  p(x). 

b.  Construya  un  histograma  de  probabilidad  para  x. 

4.90  Equipo  defectuoso  Una  pieza  de  equipo 
electronico  contiene  seis  chips  de  computadora,  dos  de 
los  cuales  son  defectuosos.  Al  azar  se  seleccionan  tres 
chips,  se  retiran  del  equipo  y  se  inspeccionan.  Sea  x  igual 
al  numero  de  defectos  observados,  donde  x  =  0,  1  o  2. 
Encuentre  la  distribucion  de  probabilidad  para  x.  Exprese 
los  resultados  graficamente  como  un  histograma  de 
probabilidad. 


4.91  Perforation  de  pozos  petroleros  La  experiencia 
del  pasado  ha  demostrado  que,  en  promedio,  solo  uno  de 
cada  10  pozos  produce  petroleo.  Sea  x  el  numero  de  perfora- 
ciones  hasta  el  primer  exito  (se  encuentra  petroleo).  Suponga 
que  las  perforaciones  representan  eventos  independientes. 

a.  Encuentre  p(  1),  p( 2)  y  p( 3). 

b.  De  una  formula  para  p(x). 

c.  Grafique  p(x). 

4.92  iAIguien  juega  tenis?  Dosjugadores 
profesionales,  Ay  B,  estan  programados  para  jugar  un 
partido:  el  ganador  es  el  primer  jugador  en  ganar  tres  sets 
de  un  total  que  no  puede  pasar  de  cinco  sets.  El  evento  en 
que  A  gane  algun  set  es  independiente  del  evento  de  que 
A  gane  cualquier  otro  y  la  probabilidad  de  que  A  gane 
cualquier  set  es  igual  a  .6.  Sea  x  igual  al  numero  total  de 
sets  del  partido;  esto  es,  x  =  3,  4  o  5.  Encuentre p(x). 

4.93  Tenis,  otra  vez  La  probabilidad  de  que  el  jugador 
A  pueda  ganar  un  set  contra  el  jugador  B  es  una  medida  de 
las  capacidades  comparativas  de  los  dos  jugadores.  En  el 
ejercicio  4.92  se  encontro  la  distribucion  de  probabilidad 
para  x,  el  numero  de  sets  requeridos  para  jugar  un  partido 
del  mejor  en  cinco  sets,  dado  que  la  probabilidad  de  que  A 
gane  cualquier  set,  llame  P(A)  a  esto,  es  .6. 

a.  Encuentre  el  numero  esperado  de  sets  necesario  para 
completar  el  partido  para  P{A )  =  .6. 

b.  Encuentre  el  numero  esperado  de  sets  necesario  para 
completar  el  partido  cuando  los  jugadores  sean  de 
igual  capacidad,  es  decir,  P(A)  =  .5. 

c.  Encuentre  el  numero  esperado  de  sets  necesario  para 
completar  el  partido  cuando  los  jugadores  difieran  en 
mucho  en  capacidad,  es  decir,  por  ejemplo,  P(A)  =  .9. 

4.94  La  PGA  Un  jugador  profesional  de  golf  juega 
mejor  en  hoyos  a  corta  distancia.  La  experiencia  ha 
demostrado  que  los  numeros  x  de  tiros  necesarios 
para  hoyos  de  par  3,  4  y  5  tienen  las  distribuciones  de 
probabilidad  que  se  muestran  en  la  tabla: 


Hoyos  par  3 

Hoyos  par  4 

Hoyos  par  5 

x  p(x) 

X 

PM 

x  p(x) 

2 

.12 

3 

.14 

4 

.04 

3 

.80 

4 

.80 

5 

.80 

4 

.06 

5 

.04 

6 

.12 

5 

.02 

6 

.02 

7 

.04 

(,Cual  es  la  puntuacion  esperada  del  jugador  de  golf  en 
estos  hoyos? 

a.  Un  hoyo  de  par  3 

b.  Un  hoyo  de  par  4 

c.  Un  hoyo  de  par  5 

4.95  Asegurar  sus  diamantes  Una  persona  puede 
asegurar  un  diamante  de  $50000  por  su  valor  total  si 
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paga  una  prima  de  D  dolares.  Si  la  probabilidad  de  robo 
en  un  ano  determinado  se  calcula  que  es  .01,  ^que  prima 
debe  cobrar  la  companfa  de  seguros  si  desea  que  la 
ganancia  esperada  sea  igual  a  $1000? 

4.96  Prueba  de  la  FDA  La  duration  maxima  de 
patente  para  un  nuevo  medicamento  es  17  anos.  La  resta 
del  tiempo  requerido  por  la  FDA  para  probar  y  aprobar  el 
medicamento  da  la  vida  real  de  patente  del  medicamento, 
es  decir,  el  tiempo  que  una  companfa  tiene  para  recuperar 
costos  de  investigacion  y  desarrollo  y  obtener  una 
utilidad.  Suponga  que  la  distribucion  de  tiempos  de 
vida  de  patente  para  nuevos  medicamentos  es  como  se 
muestra  a  continuacion: 


Anos,  x 

3 

4 

5 

B 

7 

8 

pM 

.03 

.05 

.07 

.10 

.14 

.20 

Anos,  x 

9 

10 

11 

12 

13 

pM 

.18 

.12 

.07 

.03 

.01 

a.  Encuentre  el  numero  esperado  de  anos  de  vigencia  de 
patente  para  un  nuevo  medicamento. 

b.  Encuentre  la  desviacion  estandar  de  x. 

c.  Encuentre  la  probabilidad  de  que  x  caiga  en  el 
intervalo  /jl  ±  2cr. 

4.97  Descanso  para  tomar  cafe  ^Toma  usted  cafe? 
Si  es  asf,  ^cuantos  descansos  para  tomar  cafe  se  da 
cuando  esta  en  el  trabajo  o  en  la  escuela?  Casi  todas  las 
personas  que  toman  cafe  se  dan  un  poco  de  tiempo  para 
tomarlo  y  muchas  se  dan  mas  de  un  descanso  al  dfa 
para  tomarlo.  La  tabla  siguiente,  adaptada  de  un  Snapshot 
de  USA  Today  muestra  la  distribucion  de  probabilidad 
para  x,  el  numero  de  descansos  diarios  por  dfa  que  se  dan 
quienes  toman  cafe.6 


X 

0 

1 

2 

3 

4 

5 

pM 

.28 

.37 

.17 

.12 

.05 

.01 

a.  (',Cual  es  la  probabilidad  de  que  una  persona  que  toma 
cafe,  seleccionada  al  azar,  no  se  de  descanso  para 
tomar  cafe  durante  el  dfa? 

b.  ('  Cual  es  la  probabilidad  de  que  una  persona  que  toma 
cafe,  seleccionada  al  azar,  se  de  mas  de  dos  descansos 
para  tomar  cafe  durante  el  dfa? 

c.  Calcule  la  media  y  desviacion  estandar  para  la  variable 
aleatoria  x. 

d.  Encuentre  la  probabilidad  de  que  x  caiga  en  el 
intervalo  /jl  ±  2a. 

4.98  Cargos  por  envlo  Por  experiencia,  una 
companfa  de  transporte  sabe  que  el  costo  de  entregar  un 
paquete  pequeno  antes  de  24  horas  es  de  $14.80.  La 
companfa  cobra  $15.50  por  el  envfo  pero  garantiza 

la  devolution  del  cargo  si  no  lo  entrega  antes  de  24 
horas.  Si  la  companfa  no  hace  entregas  en  solo  2%  de 
su  paqueterfa  antes  del  periodo  de  24  horas,  ('  cual  es  la 
ganancia  esperada  por  paquete? 

4.99  Actuarios  El  representante  de  una  empresa 
manufacturera  esta  considerando  tomar  una  poliza  de 
seguro  para  cubrir  posibles  perdidas  en  que  incurre  al 
vender  un  nuevo  producto.  Si  el  producto  es  un  completo 
fracaso,  el  representante  piensa  que  incurrira  en  una 
perdida  de  $800000;  si  es  solo  un  exito  moderado, 
incurrira  en  una  perdida  de  $250  000.  Los  actuarios  de 
seguros  han  determinado,  por  estudios  de  mercado  y  otra 
information  disponible,  que  las  probabilidades  de  que 

el  producto  sea  un  fracaso  o  solo  tendra  exito  moderado 
son  .01  y  .05,  respectivamente.  Suponiendo  que  el 
representante  de  la  empresa  manufacturera  este  dispuesto 
a  ignorar  todas  las  otras  posibles  perdidas,  <,que  prima 
debe  cobrar  la  companfa  de  seguros  por  una  poliza  para 
no  tener  perdida  ni  ganancia? 


REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Experimentos  y  espacio  muestral 

1.  Experimentos,  eventos,  eventos  mutuamente 
exclusivos,  eventos  simples 

2.  El  espacio  muestral 

3.  Diagramas  de  Venn,  diagramas  de  arbol,  tablas  de 
probabilidad 

II.  Probabilidades 

1 .  Definition  de  probabilidad  de  frecuencia  relativa 


2.  Propiedades  de  probabilidades 

a.  Cada  probabilidad  esta  entre  0  y  1 . 

b.  La  suma  de  todas  las  probabilidades  de  evento 
simple  es  igual  a  1 . 

3.  P(A),  la  suma  de  las  probabilidades  para  todos  los 
eventos  simples  en  A. 

III.  Reglas  de  conteo 

1.  Regia  inn;  Regia  mn  extendida 
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2.  Permutaciones:  P“  =  - — — — -r 

(n  —  r)! 

n\ 

3.  Combinaciones:  C ,  =  — r. — : - r 

r\(n  —  r)\ 

IV.  Relaciones  de  eventos 

1.  Uniones  e  intersecciones 

2.  Eventos 

a.  Disjuntos  o  mutuamente  excluyentes: 
P(A  DB)  =  0 

b.  Complementarios:  P(A)  =  1  —  P(AC) 

3.  Probabilidad  condicional:  P{A\B)  = 

4.  Eventos  independientes  y  dependientes 

5.  Regia  de  la  adicion: 

P(A  U  B)  =  P(A )  +  P(B)  -  P(A  n  B) 


6.  Regia  de  la  multiplicacion:  P(A  fl  B)  =  P(A) 
P(B\A ) 

7.  Ley  de  probabilidad  total 

8.  Regia  de  Bayes 

V.  Variables  aleatorias  discretas  y 
distribuciones  de  probabilidad 

1.  Variables  aleatorias,  discretas  y  continuas 

2.  Propiedades  de  distribuciones  de  probabilidad 

a.  0  ^  pix)  <  1 

b.  tp(x)  =  1 

3.  Media  o  valor  esperado  de  una  variable  aleatoria 
discreta:  /x  =  Xxp(x) 

4.  Varianza  y  desviacion  estandar  de  una  variable 
aleatoria  discreta:  cr2  =  X(x  —  pYp(x)  y 

a  =  aTc? 


Distribuciones  discretas  de  probabilidad 


Aun  cuando  el  MINITAB  no  puede  ayudar  a  resolver  los  tipos  de  problemas  generales  de 
probabilidad  presentados  en  este  capitulo,  es  util  para  graficar  la  distribucion  de  proba¬ 
bilidad  p(x)  para  una  variable  general  x  aleatoria  discreta  cuando  se  conocen  las  probabi- 
lidades,  y  para  calcular  la  media,  varianza  y  desviacion  estandar  de  la  variable  aleatoria  x. 
En  los  capitulos  5  y  6,  usaremos  MINITAB  para  calcular  las  probabilidades  exactas  para 
tres  casos  especiales:  el  binomial,  el  Poisson  y  las  variables  aleatorias  normales. 

Supongamos  que  usted  tiene  esta  distribucion  general  de  probabilidad: 


x 

pix) 


0 

.25 


1_ 3 

.35  .25 


5 

.15 


Introduzca  los  valores  de  x  y  p(x)  en  las  columnas  Cl  y  C2  de  una  hoja  de  trabajo  MINI- 
TAB  nueva.  En  las  cajas  grises  un  poco  abajo  de  C3,  C4  y  C5,  respectivamente,  escriba 
los  nombres  “Media”,  “Varianza”  y  “Std  Dev”.  Ahora  puede  usar  el  comando  Calc  — > 
Calculator  para  calcular  [i,  a2  y  cr  y  para  guardar  los  resultados  en  las  columnas  C3- 
C5  de  la  hoja  de  trabajo.  Use  el  mismo  metodo  para  los  tres  parametros.  En  el  cuadro 
de  dialogo  Calculator,  seleccione  “Media”  como  la  columna  en  la  cual  guardar  p..  En 
la  caja  Expression,  use  la  lista  de  Funciones,  las  teclas  de  la  calculadora  y  la  lista  de 
variables  de  la  izquierda  para  resaltar,  select,  y  genere  la  expresion  para  la  media  (vease 
la  figura  4.19): 


SUM(‘x’*p(x)’) 
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FIGURA  4.19 


j MINITAB  multiplicara  el  elemento  de  cada  renglon  en  Cl  por  el  correspondiente  ele- 
mento  de  renglon  en  C2,  suma  los  productos  resultantes  y  guarda  el  resultado  en  C3 !  Se 
puede  comprobar  manualmente  el  resultado  si  se  desea.  Las  formulas  para  la  varianza  y 
desviacion  estandar  se  seleccionan  de  un  modo  semejante: 

Varianza:  SUM((‘x’  —  ‘Media’)**2*‘p(x)’) 

Std  Dev:  SQRT(‘Varianza’) 

Para  ver  la  forma  tabular  de  la  distribucion  de  probabilidad  y  los  tres  parametros,  use 
Data  — »  Display  Data  y  seleccione  las  cinco  columnas.  De  un  clic  en  OK  y  los  resulta- 
dos  se  exhibiran  en  la  ventana  Session,  como  se  muestra  en  la  figura  4.20. 

El  histograma  de  probabilidad  se  puede  graficar  usando  el  comando  MINITAB  Graph 
— >  Scatterplot  — >  Simple  — >  OK.  En  el  cuadro  de  dialogo  Scatterplot  (figura  4.21), 
seleccione  ‘p(x)’  para  Y  variables  y  ‘x’  para  X  variables.  Para  exhibir  las  barras  dis- 
cretas  de  probabilidad,  de  un  clic  en  Data  View,  quite  la  marca  de  la  caja  marcada 
“Symbols”,  y  ponga  marca  en  la  caja  marcada  “Project  Lines”.  De  un  doble  clic  en  OK 
para  ver  la  grafica.  Vera  una  sola  recta  proyectada  en  cada  uno  de  los  cuatro  valores  de 
x.  Si  desea  que  la  grafica  se  vea  mas  como  los  histogramas  discretos  de  probabilidad 
de  la  seccion  4.8,  coloque  el  cursor  en  una  de  las  rectas,  de  un  clic  derecho  del  mouse  y 
escoja  “Edit  Project  Lines”.  Bajo  la  ficha  “Attributes”,  seleccione  Custom  y  cambie  el 
tamano  de  recta  a  75.  De  un  click  en  OK.  Si  el  ancho  de  barra  no  es  satisfactorio,  puede 
reajustar  el  tamano  de  la  recta.  Por  ultimo,  de  un  clic  derecho  en  el  eje  X,  escoja  “Edit  X 
Scale”  y  seleccione  —  .5  y  5.5  para  las  Scale  Ranges  minimas  y  maximas.  De  un  clic  en 
OK.  El  histograma  de  probabilidad  se  muestra  en  la  figura  4.22. 

Localice  la  media  en  la  grafica.  i Esta  en  el  centra  de  la  distribucion?  Si  usted  marca 
dos  desviaciones  estandar  en  cualquier  lado  de  la  media,  ('  casi  todos  los  posibles  valores 
de  x  caen  en  este  intervalo? 
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FIGURA  4.20 
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EJercicios  suplementarios 

Los  ejercicios  con  asterisco  (*)  son  opcionales. 

4.100  Jugar  en  tragamonedas  Unamaquina 
tragamonedas  tiene  tres  ranuras;  cada  una  muestra  una 
cereza,  un  limon,  una  estrella  o  una  barra  cuando  se 
hace  girar.  El  jugador  gana  si  las  tres  ranuras  muestran 
los  mismos  tres  objetos.  Si  es  igualmente  probable 
que  cada  uno  de  los  cuatro  objetos  aparezca  en  un  giro 
determinado,  ('  cual  es  su  probabilidad  de  ganar? 

4.101  Sopladores  de  silbato  “Sopladores  de  silbato” 
es  el  nombre  que  se  da  a  empleados  que  informan  de  un 
fraude  corporativo,  robo  u  otras  actividades  nada  eticas  y 
tal  vez  delictivas  cometidas  por  companeros  de  trabajo  o 
por  su  empleador.  Aun  cuando  hay  proteccion  legal  para  los 
“sopladores  de  silbato”,  se  ha  informado  que  alrededor  de 
23%  de  quienes  informan  de  fraude  sufren  represalias  como 
por  ejemplo  degradacion  o  calificacion  de  mal  rendimiento. 
Suponga  que  la  probabilidad  de  que  un  empleado  no  informe 
de  un  caso  de  fraude  es  .69.  Encuentre  la  probabilidad  de 
que  un  trabajador  que  observe  un  caso  de  fraude  informe  del 
mismo  y  despues  sufra  alguna  forma  de  represalia. 

4. 1 02  Aspirina  Dos  tabletas  para  resfriado  se  colocan 
accidentalmente  en  una  caja  que  contiene  dos  aspirinas. 
Las  cuatro  tabletas  son  identicas  en  apariencia.  Una 
tableta  se  selecciona  al  azar  de  la  caja  y  es  tomada  por  el 
primer  paciente.  A  continuacion  se  selecciona  una  tableta 
al  azar  de  las  tres  tabletas  restantes  y  es  tomada  por  el 
segundo  paciente.  Defina  los  siguientes  eventos  como 
conjuntos  especificos  de  eventos  simples: 

a.  El  espacio  muestral  S. 

b.  El  evento  A  que  el  primer  paciente  obtuvo  una  tableta 
para  resfriado. 

c.  El  evento  B  de  que  exactamente  uno  de  los  dos 
pacientes  obtuvo  una  tableta  para  resfriado. 

d.  El  evento  C  de  que  ningiin  paciente  obtuvo  una  tableta 
para  resfriado. 

4. 1 03  Consulte  el  ejercicio  4. 102.  Resumiendo  las 
probabilidades  de  eventos  simples,  encuentre  P(A),  P(B), 
P(A  n  B),  P(A  U  B),  P(Q,  P(A  n  C)  y  P(A  U  C). 

4.104  Reproductores  de  discos  de  video  Un 

detallista  vende  dos  estilos  de  grabadoras  de  video  digitales 
de  alto  precio  (DVR)  que  la  experiencia  indica  que  tienen 
igual  demanda.  (50%  de  todos  los  potenciales  compradores 
prefieren  el  estilo  1  y  50%  estan  a  favor  del  estilo  2.)  Si  el 
detallista  tiene  en  existencia  cuatro  de  cada  uno,  6cual  es  la 
probabilidad  de  que  los  cuatro  primeros  clientes  que  buscan 
una  DVR  compren  el  mismo  estilo? 

4.105  Comercio  interestatal  Uncontenedor 
de  embarques  contiene  siete  sistemas  electronicos 


complejos.  Sin  que  el  comprador  lo  sepa,  tres  estan 
defectuosos.  Dos  de  los  siete  son  seleccionados  para 
pruebas  completas  y  luego  son  clasificados  como 
defectuosos  o  no  defectuosos.  ^Cual  es  la  probabilidad  de 
que  no  se  encuentren  defectuosos? 

4.106  iquipo  pesado  Un  vendedor  de  equipo  pesado 
puede  comunicarse  con  uno  o  dos  clientes  por  dfa  con 
probabilidades  1/3  y  2/3,  respectivamente.  Cada  contacto 
resultara  en  no  venta  o  en  una  venta  de  $50000  con 
probabilidades  de  9/10  y  1/10,  respectivamente.  ^Cual  es 
el  valor  esperado  de  sus  ventas  diarias? 

4.107  Seguro  contra  incendios  Se  piensa  que  un 
condado  donde  hay  un  gran  numero  de  casas  rurales  tiene 
60%  de  esas  casas  aseguradas  contra  incendios.  Cuatro 
propietarios  de  casas  rurales  se  seleccionan  al  azar  de 
entre  toda  la  poblacion  y  se  encuentra  que  x  de  ellos  estan 
asegurados  contra  incendios.  Encuentre  la  distribucion 
de  probabilidad  para  x.  <',Cual  es  la  probabilidad  de  que  al 
menos  tres  de  los  cuatro  esten  asegurados? 

4.108  Alarmas  contra  incendios  Un  aparato  para 
deteccion  de  incendios  usa  tres  celdas  sensibles  a  la 
temperatura  que  actuan  de  manera  independiente  entre 
si,  en  forma  tal  que  cualquiera  de  ellas  puede  activar 
la  alarma.  Cada  celda  tiene  una  probabilidad  p  =  .8  de 
activar  la  alarma  cuando  la  temperatura  alcance  100°F 
o  mas.  Sea  x  igual  al  numero  de  celdas  que  activen  la 
alarma  cuando  la  temperatura  llegue  a  100°F. 

a.  Encuentre  la  distribucion  de  probabilidad  de  x. 

b.  Encuentre  la  probabilidad  de  que  la  alarma  funcionara 
cuando  la  temperatura  alcance  los  100°F. 

c.  Encuentre  el  valor  esperado  y  la  varianza  para  la 
variable  aleatoria  x. 

4.109  Pescar  un  resfrio  ^Su  probabilidad  de 
contraer  un  resfriado  esta  influida  por  el  numero 

de  contactos  sociales  que  tenga?  Un  estudio  hecho  por 
Sheldon  Cohen,  profesor  de  psicologia  de  la  Carnegie 
Mellon  University,  parece  demostrar  que  cuantas  mas 
relaciones  sociales  tenga  alguien,  menos  susceptible 
sera  a  los  resfriados.  Un  grupo  de  276  hombres  y 
mujeres  sanos  se  agruparon  de  acuerdo  al  numero 
de  sus  relaciones  (por  ejemplo  de  padres,  amigos, 
miembros  de  la  iglesia,  vecinos).  A  continuacion 
fueron  expuestos  a  un  virus  que  produce  el  resfriado. 

En  la  tabla  siguientes  se  presenta  una  adaptacion  de  los 
resultados:7 


Numero  de  relaciones 


Tres  o  menos 

Cuatro  o  cinco 

Seis  o  mas 

Resfriado 

49 

43 

34 

No  resfriado 

31 

57 

62 

Total 

80 

100 

96 

www.FreeLibros.me 


EJERCICIOS  SUPLEMENTARIOS  O  177 


a.  Si  una  persona  se  selecciona  al  azar  de  entre  las  276 
del  estudio,  ^cual  es  la  probabilidad  de  que  la  persona 
tenga  un  resfriado? 

b.  Si  dos  personas  se  seleccionan  al  azar,  ycual  es 
la  probabilidad  de  que  una  tenga  cuatro  o  cinco 
relaciones  y  la  otra  tenga  seis  o  mas  relaciones? 

c.  Si  una  sola  persona  se  selecciona  al  azar  y  tiene  un 
resfriado,  ^cual  es  la  probabilidad  de  que  el  o  ella 
tenga  tres  o  menos  relaciones? 

4.110  Genetica  de  plantas  Consulte  el 
experimento  realizado  por  Gregor  Mendel 
en  el  ejercicio  4.64.  Supongamos  que  usted  esta 
interesado  en  seguir  dos  caracterfsticas  independientes 
en  chicharos,  textura  suave  (S  =  suave,  s  =  arrugada) 
y  color  de  semilla  (Y  =  amarilla,  y  =  verde),  en  un 
cruce  de  segunda  generation  de  padres  heterocigotos. 
Complete  la  tabla  con  los  pares  de  genes  para  ambas 
caracterfsticas.  Todos  los  apareamientos  son  igualmente 
probables. 


Color  de  semilla 


Textura  de  semilla 

yy 

yY 

Yy 

YY 

ss 

(ss  yy) 

(ss  yY) 

sS 

Ss 

ss 

a.  i,Que  proporcion  de  los  descendientes  de  este  cruce 
tendra  chicharos  amarillos  de  superficie  suave? 

b.  ^Que  proporcion  de  los  descendientes  tendra  chicharos 
verdes  de  superficie  suave? 

c.  (',Que  proporcion  de  los  descendientes  tendra  chicharos 
amarillos  arrugados? 

d.  ^Que  proporcion  de  los  descendientes  tendra  chicharos 
verdes  arrugados? 

e.  Dado  que  un  descendiente  tiene  chicharos  amarillos  de 
superficie  suave, c u a  I  es  la  probabilidad  de  que  este 
descendiente  lleve  un  alelo  s?  (',0  un  alelo  s  y  ademds 
un  alelo  y? 

4.111  Acciones  rentables  Una  inversionista 
tiene  la  option  de  invertir  en  tres  de  cinco  acciones 
recomendadas.  Sin  saberlo  ella,  solo  dos  mostraran 
una  utilidad  importante  dentro  de  los  siguientes 
5  anos.  Si  ella  selecciona  las  tres  acciones  al  azar  (dando 
a  toda  combination  de  tres  acciones  una  oportunidad 
igual  de  selection),  <cual  es  la  probabilidad  de  que 
ella  seleccione  las  dos  acciones  rentables?  (Cual  es 
la  probabilidad  de  que  seleccione  solo  una  de  las  dos 
acciones  rentables? 


4.112  <iSesgo  racial?  Cuatro  trabaj adores 
sindicalizados,  dos  de  un  grupo  minoritario,  son 
asignados  a  cuatro  trabajos  diferentes  de  un  solo  hombre, 
que  se  puede  clasificar  en  orden  de  conveniencia. 

a.  Defina  el  experimento. 

b.  Haga  una  lista  de  los  eventos  simples  en  S. 

c.  Si  la  asignacion  de  los  trabajos  no  esta  sesgada, 
es  decir,  si  cualquier  orden  de  asignaciones  es  tan 
probable  como  cualquier  otro,  -cual  es  la  probabilidad 
de  que  los  dos  trabaj  adores  del  grupo  minoritario  sean 
asignados  a  los  trabajos  menos  deseables? 

4.113  Una  vendedora  reticente  Unavendedora 
calcula  que  la  probabilidad  de  que  ella  realice  una  venta 
durante  el  primer  contacto  con  un  cliente  es  .4,  pero 
mejora  a  .55  en  el  segundo  contacto  si  el  cliente  no 
compro  durante  el  primer  contacto.  Suponga  que  esta 
vendedora  hace  una  llamada  de  retorno,  y  solo  una,  a  un 
cliente.  Si  ella  hace  contacto  con  un  cliente,  calcule  las 
probabilidades  de  estos  eventos: 

a.  El  cliente  comprara. 

b.  El  cliente  no  comprara. 

4.114  Autobus  o  metro  Un  hombre  toma  ya  sea  un 
autobus  o  el  metro  para  ir  al  trabajo,  con  probabilidades  .3 
y  .7,  respectivamente.  Cuando  toma  el  autobus,  llega  tarde 
30%  de  los  dfas.  Cuando  toma  el  metro,  llega  tarde  20% 
de  los  dfas.  Si  el  hombre  llega  tarde  al  trabajo  en  un  dfa 
particular,  ycual  es  la  probabilidad  de  que  tomo  el  autobus? 

4.115  Proyectiles  dirigidos  El  porcentaje  de  falla 
para  un  sistema  de  control  de  proyectiles  dirigidos  es  1 
en  1000.  Suponga  que  un  sistema  de  control  duplicado, 
pero  completamente  independiente,  se  instala  en  cada 
proyectil  para  que,  si  el  primero  falla,  el  segundo 
tome  el  control.  La  confiabilidad  de  un  proyectil  es  la 
probabilidad  de  que  no  falle.  ()Cual  es  la  confiabilidad 
del  proyectil  modificado? 

4.1 16  Camiones  en  renta  Una  agencia  de  renta 
de  camiones  da  servicio  regularmente  a  sus  vehfculos, 
revisando  de  rutina  los  problemas  mecanicos.  Suponga  que 
la  agencia  tiene  seis  camionetas  de  mudanzas  tipo  van,  dos 
de  las  cuales  necesitan  frenos  nuevos.  Durante  una  revi¬ 
sion  de  rutina,  las  camionetas  son  probadas  una  por  una. 

a.  <',CuaI  es  la  probabilidad  de  que  la  ultima  camioneta 
con  problemas  de  frenos  sea  la  cuarta  que  se  pruebe? 

b.  (:,CuaI  es  la  probabilidad  de  que  no  mas  de  cuatro 
camionetas  necesiten  ser  probadas  antes  de  detectarse 
problemas  de  frenos? 

c.  Dado  que  una  camioneta  con  frenos  en  mal  estado 
sea  detectada  en  las  primeras  dos  pruebas,  /cual  es  la 
probabilidad  de  que  la  camioneta  restante  se  encuentre 
en  la  tercera  o  cuarta  revision? 
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4.117  Loteri'a  de  Pennsylvania  La  probabilidad 
desempeno  un  papel  en  el  manipuleo  fraudulento  de  la 
loterfa  del  estado  de  Pennsylvania,  del  24  de  abril  de 
1980.  Para  determinar  cada  dfgito  del  numero  ganador 
de  tres  dfgitos,  cada  uno  de  los  numeros  0,1,2,..., 

9  se  escribe  en  una  pelota  de  ping-pong,  las  10  pelotas 
son  sopladas  hacia  un  compartimento  y  el  numero 
seleccionado  para  el  dfgito  es  uno  de  la  pelota  que 
flota  a  la  parte  superior  de  la  maquina.  Para  alterar  la 
probabilidad,  los  conspiradores  inyectaron  un  lfquido  en 
todas  las  pelotas  empleadas  en  el  juego  excepto  en  las 
numeradas  4  y  6,  haciendo  casi  seguro  que  las  pelotas 
mas  ligeras  serfan  seleccionadas  para  determinar  los 
dfgitos  del  numero  ganador.  Entonces  procedieron  a 
comprar  billetes  de  loterfa  con  los  potenciales  numeros 
ganadores.  ^Cuantos  numeros  ganadores  potenciales 
hubo  (666  fue  el  numero  ganador)? 

*4.118  Loteri'a,  continua  Consulte  el  ejercicio 
4.1 17.  Horas  despues  que  el  manipuleo  fraudulento  de 
la  loterfa  del  estado  de  Pennsylvania  fuera  anunciado  el 
19  de  septiembre  de  1980,  oficiales  de  la  loterfa  del 
estado  de  Connecticut  quedaron  asombrados  de  saber 
que  el  numero  ganador  de  ellos  para  el  dfa  fue  el  666. 

a.  Toda  evidencia  indica  que  la  seleccion  de  Connecticut 
fue  pura  casualidad.  (:Cual  es  la  probabilidad  de  que 
el  666  sea  sacado  en  Connecticut,  dado  que  el  666  se 
habfa  seleccionado  el  24  de  abril  de  1980  en  la  loterfa 
de  Pennsylvania? 

b.  ('Cual  es  la  probabilidad  de  sacar  el  666  en  la  loterfa 
del  24  de  abril  de  1980  en  Pennsylvania  (recuerde, 
este  saque  fue  fraudulento)  y  ademds  un  666  el  19  de 
septiembre  de  1980  en  la  loterfa  de  Connecticut? 

*4.1 19  Desgarres  de  la  ACL/MCL  The  American 
Journal  of  Sports  Medicine  publico  un  estudio  de  810 
jugadoras  universitarias  de  rugby  que  tienen  historias 
clfnicas  de  lesiones  en  rodillas.  Para  estas  atletas, 
las  dos  lesiones  de  rodilla  comunes  investigadas 
fueron  torceduras  del  ligamento  cruzado  medio  (MCL) 
y  desgarres  del  ligamento  cruzado  anterior  (ACL).8 
Para  las  jugadoras  de  las  posiciones  de  defensas, 
se  encontro  que  39%  tenfan  torceduras  del  MCL  y 
61%  tenfan  desgarres  del  ACL.  Para  las  jugadoras  de 
posiciones  delanteras,  se  encontro  que  33%  de  ellas 
tenfan  torceduras  del  MCL  y  67%  tenfan  torceduras  del 
ACL.  Como  un  equipo  de  rugby  esta  formado  por  ocho 
delanteras  y  siete  defensas,  se  puede  suponer  que  47%  de 
las  jugadoras  con  lesiones  en  rodillas  son  defensas  y  53% 
son  delanteras. 

a.  Encuentre  la  probabilidad  incondicional  de  que  una 
jugadora  de  rugby  seleccionada  al  azar  de  entre  este 
grupo  haya  experimentado  una  torcedura  del  MCL. 


b.  Dado  que  se  ha  seleccionado  una  jugadora  que  tiene 
una  torcedura  del  MCL,  ^cual  es  la  probabilidad  de 
que  la  jugadora  sea  delantera? 

c.  Dado  que  se  ha  seleccionado  una  jugadora  que  tiene 
un  desgarre  del  ACL,  ^cual  es  la  probabilidad  de  que 
la  jugadora  sea  defensa? 

4. 1 20  Las  resonancias  magneticas  (MRI)  son 
examenes  aceptados  no  invasivos  para  evaluar  cambios  en 
el  cartflago  de  articulaciones.  Un  artfculo  de  The  American 
Journal  of  Sports  Medicine  compare  los  resultados  de 
una  evaluation  de  MRI,  contra  una  evaluation  de  cirugfa 
artroscopica  de  desgarres  de  cartflago,  en  dos  sitios  en  las 
rodillas  de  35  pacientes.  Los  examenes  de  2  X  35  =  70 
produjeron  las  clasificaciones  que  se  muestran  en  la  tabla 
siguiente.9  Los  desgarres  reales  fueron  confirmados  por 
examen  de  cirugfa  artroscopica. 

Desgarres  No  desgarres  Total 

MRI  positiva  27  0  27 

MRI  negativa  4  39  43 

Total  31  39  70 

a.  (\CuaI  es  la  probabilidad  de  que  un  sitio  seleccionado 
al  azar  tenga  un  desgarre  y  haya  sido  identificado 
como  desgarre  por  la  MRI? 

b.  (iCual  es  la  probabilidad  de  que  un  sitio  seleccionado 
al  azar  no  tenga  desgarre  y  haya  sido  identificado 
como  que  sf  lo  tiene? 

c.  (,Cual  es  la  probabilidad  de  que  un  sitio  seleccionado 
al  azar  tenga  desgarre  y  no  haya  sido  identificado  por 
la  MRI? 

d.  (iCual  es  la  probabilidad  de  una  MRI  negativa,  dado 
que  hay  desgarre? 

e.  (,CuaI  es  la  probabilidad  de  un  falso  negativo,  es  decir, 
una  MRI  negativa,  dado  que  hay  desgarre? 

4.121  El  juego  en  pares  Cada  uno  de  dos  hombres 
tiran  al  aire  una  moneda.  Obtienen  un  “match”  si  ambas 
monedas  son  caras  o  sin  ambas  son  cruces.  Suponga  que 
el  tiro  se  repite  tres  veces. 

a.  (iCual  es  la  probabilidad  de  tres  pares? 

b.  (iCual  es  la  probabilidad  de  que  los  seis  tiros  (tres  para 
cada  hombre)  resulten  en  cruces? 

c.  El  tiro  de  monedas  al  aire  da  un  modelo  para  muchos 
experimentos  practicos.  Suponga  que  los  tiros  de 
monedas  representan  las  respuestas  dadas  por  dos 
estudiantes  a  tres  preguntas  especfficas  de  verdadero  o 
falso  en  un  examen.  Si  los  dos  estudiantes  dieron  tres 
pares  por  respuestas,  (4a  probabilidad  baja  hallada  en 
el  inciso  a)  sugiere  una  confabulation? 

4.122  IMegociaciones  de  contrato  La  experiencia 
ha  demostrado  que,  50%  del  tiempo,  una  negotiation 
particular  entre  empresa  y  sindicato  llevo  a  un  acuerdo 
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antes  de  transcurridas  dos  semanas,  60%  del  tiempo  el 
fondo  de  huelga  del  sindicato  era  adecuado  para  apoyar 
una  huelga  y  30%  del  tiempo  ambas  condiciones  quedaron 
satisfechas.  -  C’ual  es  la  probabilidad  de  un  acuerdo  de 
contrato  dado  que  el  fondo  sindical  para  huelga  es  adecuado 
para  soportar  una  huelga?  El  acuerdo  de  un  contrato  antes 
de  transcurridas  dos  semanas  /  depende  de  si  el  fondo 
sindical  de  huelga  es  adecuado  para  soportar  una  huelga? 

4.123  Permanencia  en  un  trabajo  Supongaque 
la  probabilidad  de  permanecer  10  anos  o  mas  con  una 
compafha  particular  es  1/6.  Un  hombre  y  una  mujer 
empiezan  a  trabajar  en  la  companfa  el  mismo  dfa. 

a.  /Cual  es  la  probabilidad  de  que  el  hombre  trabaje  ahf 
menos  de  10  anos? 

b.  ('Cual  es  la  probabilidad  de  que  el  hombre  y  la  mujer 
trabajen  ahf  menos  de  10  anos?  (Suponga  que  no 
tienen  parentesco  y  sus  tiempos  de  servicio  son 
independientes  entre  sf.) 

c.  ,'Cual  es  la  probabilidad  de  que  uno  u  otro  o  ambos 
trabajen  10  anos  o  mas? 

4.124  Seguro  de  accidentes  Los  registros  de 
accidentes,  recabados  por  una  companfa  de  seguros  de 
automoviles,  dan  la  siguiente  informacion:  la  probabilidad 
de  que  un  automovilista  asegurado  tenga  un  accidente  de 
auto  es  .15;  si  ha  ocurrido  un  accidente,  el  dano  al  vehfculo 
asciende  a  20%  de  su  valor  de  mercado  con  probabilidad 
.80,  60%  de  su  valor  de  mercado  con  probabilidad  .12  y 
perdida  total  con  probabilidad  .08.  ^Que  prima  debe  cobrar 
la  companfa  sobre  un  auto  de  $22  000  de  modo  que  la 
ganancia  esperada  por  la  companfa  sea  cero? 

4.125  Tiempos  de  espera  Suponga  que  en  un 
supermercado  particular  la  probabilidad  de  esperar  5 
minutos  o  mas  en  la  fila  para  pagar  es  .2.  En  un  dfa 
determinado,  un  hombre  y  su  esposa  deciden  hacer 
compras  individualmente  en  el  mercado,  cada  uno 
saliendo  en  diferentes  cajas  de  pago.  Ambos  began  al 
mostrador  al  mismo  tiempo. 

a.  /Cual  es  la  probabilidad  de  que  el  hombre  espere 
menos  de  5  minutos  para  salir? 

b.  <'  Cual  es  la  probabilidad  de  que  el  hombre  y  su 
esposa  salgan  en  menos  de  5  minutos?  (Suponga 
que  los  tiempo  de  salida  para  los  dos  son  eventos 
independientes.) 

c.  <'  Cual  es  la  probabilidad  de  que  uno  o  el  otro  o  ambos 
esperen  5  minutos  o  mas? 

4.126  Control  de  calidad  Un  plan  de  control  de 
calidad  exige  aceptar  un  lote  grande  de  cojinetes  para 
ciguenal  si  se  saca  una  muestra  de  siete  y  ninguno 

es  defectuoso.  ^Cual  es  la  probabilidad  de  aceptar  el 
lote  si  ninguno  del  lote  es  defectuoso?  <;Y  si  1/10  son 
defectuosos?  si  1/2  son  defectuosos? 


4.127  Transporte  colectivo  Solo  40%  de  todas  las 
personas  de  una  comunidad  esta  a  favor  de  desarrollar  un 
sistema  de  transporte  colectivo.  Si  al  azar  se  seleccionan 
cuatro  ciudadanos  de  entre  la  comunidad,  ^cual  es  la 
probabilidad  de  que  los  cuatro  esten  a  favor  del  sistema 
de  transporte  colectivo?  (;Y  de  que  ninguno  este  a 
favor  de  el? 

4.128  Mediciones  de  presion  sanguinea  Un  medico 
investigador  comparo  la  efectividad  de  dos  medicamentos 
Ay  B  para  la  presion  sanguinea,  administrando  los 

dos  a  cada  uno  de  cuatro  pares  de  gemelos  identicos. 

El  medicamento  A  se  dio  a  un  miembro  de  un  par;  el 
medicamento  B  se  dio  al  otro.  Si,  de  hecho,  no  hay 
diferencia  en  los  efectos  de  los  medicamentos,  ('icual  es 
la  probabilidad  de  que  la  cafda  en  la  lectura  de  presion 
sanguinea  para  el  medicamento  A  exceda  de  la  cafda 
correspondiente  en  la  lectura  del  medicamento  B.  para  los 
cuatro  pares  de  gemelos?  Suponga  que  el  medicamento 
B  creo  una  cafda  mas  grande  en  la  presion  sanguinea  que 
el  medicamento  A,  para  cada  uno  de  los  cuatro  pares  de 
gemelos.  [  Piensa  usted  que  esto  es  suficiente  evidencia 
para  indicar  que  el  medicamento  B  es  mas  eficaz  para 
bajar  la  presion  sanguinea  que  el  medicamento  A? 

4.129  Examenes  de  sangre  Para  reducir  el  costo  de 
detectar  una  enfermedad,  los  examenes  de  sangre 

se  realizan  en  una  muestra  agrupada  de  sangre  tomada  de 
un  grupo  de  n  personas.  Si  no  hay  indicio  de  la  enfermedad 
presente  en  la  muestra  sanguinea  de  grupo  (como  por  lo 
general  es  el  caso),  ninguno  tiene  la  enfermedad.  Si  el 
analisis  de  la  muestra  sanguinea  de  grupo  indica  que  la 
enfermedad  esta  presente,  cada  individuo  debe  someterse 
a  un  examen  de  sangre.  Los  examenes  individuales  son 
realizados  en  secuencia.  Si,  entre  un  grupo  de  cinco 
personas,  una  de  ellas  tiene  la  enfermedad,  (;cual  es  la 
probabilidad  de  que  seis  examenes  de  sangre  (incluyendo 
el  examen  de  grupo)  se  requieran  para  detectar  a  la 
persona  enferma?  Si  dos  personas  tienen  la  enfermedad, 
(■cual  es  la  probabilidad  de  que  se  requieran  seis 
examenes  para  localizar  a  ambas  personas  enfermas? 

4.130  Tiro  de  una  moneda  ^Cuantas  veces  debe  ser 
lanzada  al  aire  una  moneda  para  obtener  una  probabilidad 
igual  o  mayor  a  .9  de  observar  al  menos  una  cara? 

4.131  Horario  flexible  El  numero  de  companfas 
que  ofrecen  horarios  de  trabajo  flexibles  ha  aumentado 
a  medida  que  ellas  tratan  de  ayudar  a  sus  empleados 

a  haberselas  con  su  casa  y  su  trabajo.  Un  horario  de 
trabajo  flexible  es  trabajar  cuatro  turnos  de  10  horas.  No 
obstante,  un  gran  obstaculo  para  los  horarios  de  trabajo 
flexibles  para  trabajadores  a  quienes  se  paga  por  hora  es 
la  legislation  estatal  por  tiempo  extra.  Un  estudio  dio  la 
siguiente  informacion  para  220  empresas  localizadas  en 
dos  ciudades  de  California. 
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Horario  flexible 


Ciudad 

Disponible 

No  disponible 

Total 

A 

39 

75 

114 

B 

25 

81 

106 

Totales 

64 

156 

220 

Se  selecciona  una  compama  al  azar  de  entre  este  grupo  de 
220  compafuas. 

a.  /Cual  es  la  probabilidad  de  que  la  companla  este 
ubicada  en  la  ciudad  A? 

b.  (',Cua I  es  la  probabilidad  de  que  la  companla  este 
ubicada  en  la  ciudad  B  y  ofrezca  horarios  flexibles  de 
trabajo? 

c.  ('Cual  es  la  probabilidad  de  que  la  companla  no  tenga 
horarios  flexibles? 

d.  ('Cual  es  la  probabilidad  de  que  la  companla  este 
ubicada  en  la  ciudad  B,  dado  que  la  companla  tiene 
horarios  flexibles? 

4.132  Experimento  para  reconocer  colores  Se 

realiza  un  experimento  como  sigue:  los  colores 
rojo,  amarillo  y  azul  se  proyectan  en  una  pantalla 
durante  un  corto  periodo.  Una  persona  ve  los 
colores  y  se  le  pide  escoger  el  que  piense  que  duro 
mas  tiempo.  El  experimento  se  repite  tres  veces  con  la 
misma  persona. 

a.  Si  todos  los  colores  se  proyectaron  durante  el  mismo 
tiempo,  encuentre  la  distribucion  de  probabilidad 
para  x,  el  numero  de  veces  que  la  persona  escogio 
como  color  rojo.  Suponga  que  sus  tres  selecciones  son 
independientes. 

b.  Construya  el  histograma  de  probabilidad  para  la 
variable  aleatoria  x. 


4.133  iPepsi™  o  Coca™?  Se  realiza  un  experimento 
para  probar  el  gusto  en  un  supermercado  local,  donde 

a  compradores  que  pasan  por  ahl  se  les  pide  probar  dos 
muestras  de  bebida  gaseosa,  una  Pepsi  y  una  Coca,  y  que 
digan  su  preferencia.  Suponga  que  cuatro  compradores  se 
escogen  al  azar  y  se  les  pide  participar  en  el  experimento 
y  que  en  realidad  no  hay  diferencia  en  el  gusto  de  las  dos 
marc  as. 

a.  (\Cual  es  la  probabilidad  de  que  los  cuatro 
compradores  escojan  Pepsi? 

b.  (\Cual  es  la  probabilidad  de  que  exactamente  uno 
de  los  cuatro  compradores  escoja  Pepsi? 

4.134  Virus  Cierto  virus  afecto  a  familias  en  tres 
casas  adyacentes  en  una  fila  de  12  casas.  Si  tres  casas 
se  escogieron  al  azar  de  una  fila  de  12  casas,  ^cual  es  la 
probabilidad  de  que  las  tres  casas  fueran  adyacentes? 
(,Hay  razon  para  creer  que  este  virus  es  contagioso? 

4.135  Politics  en  una  orquesta  El  consejo  de 
directores  de  una  orquesta  sinfonica  principal  ha  votado 
por  crear  una  comision  de  miisicos  con  el  fin  de  manejar 
quejas  de  empleados.  El  consejo  estara  formado  por  el 
presidente  y  vicepresidente  del  consejo  sinfonico  y  dos 
representantes  de  la  orquesta.  Los  dos  representantes  de 
la  orquesta  seran  seleccionados  al  azar  de  una  lista  de  seis 
voluntaries,  formada  por  cuatro  hombres  y  dos  mujeres. 

a.  Encuentre  la  distribucion  de  probabilidad  para  x,  el 
numero  de  mujeres  escogidas  como  representantes  de 
la  orquesta. 

b.  Encuentre  la  media  y  varianza  para  la  variable 
aleatoria  x. 

c.  ('.Cual  es  la  probabilidad  de  que  ambos  representantes 
de  la  orquesta  sean  mujeres? 


APPLET 


4.136  Dos  dados  imparciales  se  tiran.  Use  el  applet 
Tossing  Dice  (Lanzamiento  de  dados)  para  contestar  las 
siguientes  preguntas. 

a.  (',Cua I  es  la  probabilidad  de  que  la  suma  del  numero  de 
puntos  de  las  caras  superiores  sea  igual  a  7?  /,Y  a  1 1? 

b.  (Cual  es  la  probabilidad  de  que  se  tiren  “dobles”,  esto 
es,  ambos  dados  tienen  el  mismo  numero  en  su  cara 
superior? 

c.  (Cual  es  la  probabilidad  de  que  ambos  dados  muestren 
un  numero  impar? 


4. 1 37  Si  se  tira  un  par  de  dados,  la  suma  T  del  numero 
de  puntos  que  aparece  en  las  caras  superiores  de  los 
dados  puede  tomar  el  valor  de  un  entero  del  intervalo 
2  <  7'  <  12. 

a.  Use  el  applet  Tossing  Dice  (Lanzamiento  de  dados) 
para  hallar  la  distribucion  de  probabilidad  para  T. 
Presente  esta  distribucion  de  probabilidad  en  una 
tabla. 

b.  Construya  un  histograma  de  probabilidad  para  p(T). 
((Como  se  describirfa  la  forma  de  esta  distribucion? 
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4. 1 38  Accese  al  applet  Flipping  Fair  Coins 
(Lanzamiento  de  monedas  justas).  El  experimento 
consiste  en  lanzar  al  aire  tres  monedas  imparciales  y 
registrar  x,  el  numero  de  caras. 


a.  Use  las  leyes  de  probabilidad  para  escribir  los  eventos 
simples  de  este  experimento. 

b.  Encuentre  la  distribucion  de  probabilidad  para  x. 
Presente  la  distribucion  en  una  tabla  y  en  un 
histograma  de  probabilidad. 


c.  Utilice  el  applet  Flipping  Fair  Coins  (Lanzamiento 
de  monedas  justas)  para  estimular  la  distribucion  de 
probabilidad,  es  decir,  repetir  el  experimento 
de  lanzar  al  aire  una  moneda  un  gran  numero  de  veces 
hasta  que  el  histograma  de  frecuencia  relativa  sea 
muy  cercano  a  la  distribucion  real  de  probabilidad. 
Empiece  por  efectuar  el  experimento  una  vez  (de 
un  clic  en  *l^3fl!H1M)  para  ver  que  esta  ocurriendo. 

A  continuacion  agilice  el  proceso  al  hacer  clic  en 

Genere  al  menos  2000  valores  de  x.  Trace 
el  histograma  que  haya  generado. 


d.  Compare  los  histogramas  de  los  incisos  b)  y  c).  ^La 
simulacion  confirma  su  respuesta  del  inciso  b)? 


4.139  Consulte  el  ejercicio  4.138. 

a.  Si  fueramos  a  lanzar  al  aire  solo  una  moneda,  (ic6mo 
se  verfa  la  distribucion  de  probabilidad  para  x? 

b.  Realice  una  simulacion  usando  el  applet  Flipping 
Fair  Coins  (Lanzamiento  de  monedas  justas)  con 
n  =  1 ,  y  compare  sus  resultados  con  el  inciso  a). 

4.140  Vea  el  ejercicio  4.138.  Accese  al  applet  Flipping 

Weighted  Coins  (Lanzamiento  de  monedas  no  justas). 

El  experimento  consiste  en  lanzar  al  aire  tres  monedas 

que  no  sean  imparciales  y  registrar  x,  el  numero  de  caras. 

a.  Efectue  una  simulacion  del  experimento  usando  el 
applet  Flipping  Weighted  Coins  (Lanzamiento  de 
monedas  no  justas).  (:,La  distribucion  es  simetrica 
o  esta  sesgada?  ^Cuales  son  mas  probables,  caras  o 
cruces? 

b.  Suponga  que  no  sabemos  la  probabilidad  de  obtener 
una  cara,  P(H).  Escriba  una  formula  para  calcular  la 
probabilidad  de  que  no  haya  caras  en  tres  tiros. 

c.  Use  la  probabilidad  aproximada  P(x  =  0)  de  su 
simulacion  y  los  resultados  del  inciso  b)  para 
aproximar  el  valor  de  P(T).  <',Cual  es  la  probabilidad 
de  obtener  una  cara? 


CASO 

prActico 


Probabilidad 
en  el  Congo 


y  toma  de  decisiones 


En  su  sensacional  novela  Congo,  Michael  Crichton  describe  una  busqueda,  hecha  por 
Earth  Resources  Technology  Service  (ERTS),  una  compafua  de  estudios  geologicos,  de 
depositos  de  diamantes  azules  cubiertos  de  boro  que  ERTS  piensa  que  es  la  clave  de  una 
nueva  generation  de  computadoras  opticas.10  En  la  novela,  ERTS  esta  en  una  carrera 
contra  un  consorcio  internacional  para  hallar  la  Ciudad  Perdida  de  Zinj,  una  ciudad  que 
prospero  con  la  explotacion  de  diamantes  y  existio  hace  varios  miles  de  anos  (de  acuerdo 
con  una  fabula  africana),  en  lo  profundo  de  los  bosques  lluviosos  del  este  de  Zaire. 

Despues  de  la  misteriosa  destruction  de  su  primera  expedicion,  ERTS  lanzo  una 
segunda  expedicion  bajo  el  liderazgo  de  Karen  Ross,  un  genio  de  las  computadoras,  de  24 
anos,  que  es  acompanada  por  el  profesor  Peter  Elliot,  un  antropologo;  Amy,  un  gorila  que 
habla;  y  por  el  afamado  mercenario  y  lider  de  la  expedicion,  el  “Capitan”  Charles  Munro. 
Los  esfuerzos  de  Ross  por  hallar  la  ciudad  se  ven  bloqueados  por  las  acciones  ofensivas 
del  consorcio,  por  el  mortal  bosque  lluvioso  y  por  hordas  de  gorilas  asesinos  “parlantes” 
cuya  mision  es  defender  las  minas  de  diamantes.  Ross  supera  estos  obstaculos  mediante  el 
uso  de  computadoras  de  la  era  espacial,  con  el  objeto  de  evaluar  las  probabilidades  de  exito 
para  todas  las  posibles  circunstancias  y  todas  las  posibles  acciones  que  la  expedicion  pueda 
tomar.  En  cada  etapa  de  la  expedicion,  ella  puede  rapidamente  evaluar  las  probabilidades 
de  exito. 

En  una  etapa  de  la  expedicion,  Ross  es  informada  por  su  cuartel  general  en  Houston 
que  sus  computadoras  estiman  que  ella  esta  a  18  horas  y  20  minutos  atras  del  equipo 
competidor  euro-japones,  en  lugar  de  40  horas  adelante.  Ella  cambia  de  planes  y  decide 


www.FreeLibros.me 


182  O  CAPITULO  4  PROBABILIDAD  Y  DISTRIBUCIONES  DE  PROBABILIDAD 

que  12  miembros  de  su  equipo  (Ross,  Elliot,  Munro,  Amy  y  ocho  porteadores  nativos) 
desciendan  en  paracaldas  en  una  region  volcanica  cerca  de  la  ubicacion  estimada  de  Zinj. 
Como  Crichton  lo  relata,  “Ross  tenia  probabilidades  doblemente  comprobadas  de  un 
resultado  desde  las  computadoras  de  Houston,  y  los  resultados  no  estaban  equivocados. 
La  probabilidad  de  un  salto  exitoso  era  de  .7980,  lo  cual  significaba  que  habia  aproxi- 
madamente  una  oportunidad  en  cinco  en  que  alguien  resultara  con  lesion  grave.  No  obs¬ 
tante,  dado  un  salto  exitoso,  la  probabilidad  de  exito  de  la  expedicion  era  de  .9943,  lo  cual 
hacia  practicamente  seguro  que  ganarian  el  consorcio  al  lugar”. 

Teniendo  en  mente  que  este  es  un  extracto  de  una  novela,  examinemos  la  probabili¬ 
dad,  .7980,  de  un  salto  exitoso.  Si  usted  fuera  uno  del  equipo  de  12  miembros,  (:,cual  es 
la  probabilidad  de  que  complete  con  exito  su  salto?  En  otras  palabras,  si  la  probabilidad 
de  un  salto  exitoso  por  los  12  miembros  del  equipo  es  .7980,  (',cual  es  la  probabilidad  de 
que  un  solo  miembro  pueda  con  todo  exito  completar  el  salto? 
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Las  variables  aleatorias  discretas  se  emplean  en  nume- 
rosas  aplicaciones  practicas.  En  este  capitulo  presentamos 
tres  variables  aleatorias  discretas  importantes,  la  binomial, 
la  de  Poisson  y  la  hipergeometrica.  Es  frecuente  que 
estas  variables  aleatorias  se  usen  para  describir  el  numero 
de  sucesos  de  un  evento,  especificado  en  un  numero 
fijo  de  intentos  o  una  unidad  fija  de  tiempo  o  espacio. 


©  James  Hearn/Dreamstime 

W)  Un  misterio:  canceres 
cere  a  de  un  reactor 

l  E I  reactor  nuclear  Pilgrim  I  es  responsable  del 


INDICE  DEL  CAPITULO 

La  distribucion  binomial  de  probabilidad  (5.2) 

La  distribucion  hipergeometrica  de  probabilidad  (5.4) 

La  media  y  varianza  para  la  variable  aleatoria  binomial 
(5.2) 

La  distribucion  de  probabilidad  de  Poisson  (5.3) 


aumento  en  casos  de  cancer  en  el  area  circundan- 
te?  Surgio  una  controversia  politica  cuando  el 
Departamento  de  Salud  Piiblica  de  Massachusetts 
encontro  un  numero  anormalmente  grande  de  ca¬ 
sos  en  una  franja  costera  de  4  millas  de  ancho 
un  poco  al  norte  del  reactor  nuclear  de  Plymouth, 
Massachusetts.  El  estudio  practico,  que  aparece 


ENTRENADOR  PERSONAL 


£Como  uso  la  tabla  1  para  calcular  probabilidades 
binomiales? 

£Como  calculo  probabilidades  de  Poisson  usando 
la  formula? 

£Como  uso  la  tabla  2  para  calcular  probabilidades 
de  Poisson? 


al  final  de  este  capitulo,  examina  como  esta  pre- 
gunta  se  puede  contestar  usando  una  de  las  dis- 
tribuciones  discretas  de  probabilidad  presentadas 
aqui. 
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INTRODUCTION 

Se  pueden  hallar  ejemplos  de  variables  aleatorias  discretas  en  numerosas  situaciones 
cotidianas  y  en  casi  todas  las  disciplinas  academicas.  No  obstante,  hay  tres  distribucio- 
nes  discretas  de  probabilidad  que  sirven  como  modelos  para  un  gran  numero  de  estas 
aplicaciones.  En  este  capitulo  estudiamos  las  distribuciones  de  probabilidad  binomiales, 
de  Poisson  e  hipergeometrica  y  discutimos  su  utilidad  en  diferentes  situaciones  ffsicas. 


LA  DISTRIBUCION  BINOMIAL 
DE  PROBABILIDAD 

El  experimento  de  lanzar  al  aire  una  moneda  es  un  ejemplo  sencillo  de  una  importante 
variable  aleatoria  discreta  llamada  variable  aleatoria  binomial.  Muchos  experimentos 
practicos  resultan  en  datos  similares  a  que  salgan  cara  o  cruz  al  tirar  la  moneda.  Por  ejem¬ 
plo,  considere  las  encuestas  politicas  que  se  emplean  para  predecir  las  preferencias  de 
los  votantes  en  elecciones.  Cada  votante  entrevistado  se  puede  comparar  a  una  moneda 
porque  el  votante  puede  estar  a  favor  de  nuestro  candidato  (una  “cara”)  o  no  (una  “cruz”). 
Casi  siempre,  la  proporcion  de  votantes  que  estan  a  favor  de  nuestro  candidato  no  es  igual 
a  1/2,  es  decir,  la  moneda  no  es  imparcial.  De  hecho,  la  encuesta  esta  disenada  exacta- 
mente  para  determinar  la  proporcion  de  votantes  que  estan  a  favor  de  nuestro  candidato. 

Veamos  aquf  algunas  otras  situaciones  semej  antes  al  experimento  de  lanzar  al  aire 
una  moneda: 


•  Un  sociologo  esta  interesado  en  la  proporcion  de  maestros  de  escuelas  elementa- 
les  que  sean  hombres. 

•  Una  comerciante  en  bebidas  gaseosas  esta  interesada  en  la  proporcion  de  quienes 
toman  refresco  de  cola  y  que  prefieren  la  marca  de  ella. 

•  Un  genetista  esta  interesado  en  la  proporcion  de  la  poblacion  que  posee  un  gen 
vinculado  a  la  enfermedad  de  Alzheimer. 


Cada  persona  muestreada  es  analoga  a  lanzar  al  aire  una  moneda,  pero  la  probabilidad  de 
una  “cara”  no  es  necesariamente  igual  a  1/2.  Aun  cuando  estas  situaciones  tienen  dife¬ 
rentes  objetivos  practicos,  todas  exhiben  las  caracterfsticas  comunes  del  experimento 
binomial. 


Definicion  Un  experimento  binomial  es  el  que  tiene  estas  cinco  caracterfsticas: 


1.  El  experimento  consiste  en  n  intentos  identicos. 

2.  Cada  intento  resulta  en  uno  de  dos  resultados.  Por  falta  de  un  mejor  nombre,  el 
resultado  uno  se  llama  exito,  S,  y  el  otro  se  llama  fracaso,  F. 

3.  La  probabilidad  de  exito  en  un  solo  intento  es  igual  agyes  igual  de  un  intento  a 
otro.  La  probabilidad  de  fracaso  es  igual  a  (1  —  p)  =  q. 

4.  Los  intentos  son  independientes. 

5.  Estamos  interesados  en  x,  el  numero  de  exitos  observado  durante  los  n  intentos, 
parax  =  0,  1,  2,  ...,  n. 


Suponga  que  hay  alrededor  de  un  millon  de  adultos  en  un  condado  y  una  proporcion 
desconocida  p  estan  a  favor  de  limitar  el  periodo  de  funcion  de  politicos.  Se  escogera 
una  muestra  de  mil  adultos  en  forma  tal  que  cada  uno  del  millon  de  adultos  tenga  igual 
probabilidad  de  ser  seleccionado  y  a  cada  uno  se  le  pregunta  si  el  o  ella  esta  a  favor  de 
limitar  el  periodo.  (El  objetivo  final  de  esta  encuesta  es  estimar  la  proporcion  descono¬ 
cida  p,  un  problema  que  veremos  en  el  capitulo  8.)  ^Este  experimento  es  binomial? 
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Solucion  (,EI  experimento  tiene  las  cinco  caracteristicas  binomiales? 

1.  Un  “intento”  es  la  selection  de  un  solo  adulto  de  entre  el  millon  de  adultos  del 
condado.  Esta  muestra  consta  de  n  =  1000  intentos  identicos. 

2.  Como  cada  adulto  estara  a  favor  o  no  estara  a  favor  de  limitar  el  periodo,  hay  dos 
resultados  que  representan  los  “exitos”  y  “fracasos”  del  experimento  binomial.' 

3.  La  probabilidad  de  exito,  p,  es  la  probabilidad  de  que  un  adulto  este  a  favor  del 
limite  del  periodo.  £ Esta  probabilidad  sigue  igual  para  cada  uno  de  los  adultos  de 
la  muestra?  Para  todos  los  bnes  practicos,  la  respuesta  es  si.  Por  ejemplo,  si 

500  mil  adultos  de  la  poblacion  estan  a  favor  de  limitar  el  periodo,  entonces  la 
probabilidad  de  un  “exito”  cuando  se  escoja  al  primer  adulto  es  500000/1 000000 
=  1/2.  Cuando  se  escoja  al  segundo  adulto,  la  probabilidad  p  cambia  ligera- 
mente,  dependiendo  de  la  primera  selection.  Esto  es,  habra  499999  o  500000 
exitos  que  queden  entre  los  999999  adultos.  En  cualquiera  de  estos  casos,  p  es 
todavfa  mas  o  menos  igual  a  1/2. 

4.  La  independencia  de  los  intentos  esta  garantizada  debido  al  grupo  grande  de 
adultos  del  que  se  toma  la  muestra.  La  probabilidad  de  que  un  adulto  este  a  favor 
de  limitar  el  periodo  no  cambia,  dependiendo  de  las  respuestas  de  las  personas 
previamente  escogidas. 

5.  La  variable  aleatoria  x  es  el  numero  de  adultos  de  la  muestra  que  esten  a  favor  de 
limitar  el  periodo. 

Debido  a  que  el  estudio  satisface  las  cinco  caracteristicas  razonablemente  bien,  para 
todos  los  bnes  practicos  se  puede  ver  como  un  experimento  binomial. 


Un  paciente  llena  una  receta  para  un  regimen  de  10  dias  de  dos  pildoras  diarias.  Sin  que 
lo  sepan  el  farmaceutico  ni  el  paciente,  las  20  pastillas  estan  formadas  por  18  pildoras 
del  medicamento  prescrito  y  dos  pildoras  que  son  el  equivalente  generico  del  medica- 
mento  prescrito.  El  paciente  selecciona  dos  pildoras  al  azar  para  la  dosis  del  primer  dia. 
Si  verihcamos  la  selection  y  registramos  el  numero  de  pildoras  que  son  genericas,  <;es 
este  un  experimento  binomial? 

Solucion  De  nuevo,  veribque  el  procedimiento  de  muestro  para  las  caracteristicas 
de  un  experimento  binomial. 

1.  Un  “intento”  es  la  selection  de  una  pildora  de  entre  las  20  de  la  receta.  Este  expe¬ 
rimento  consta  de  n  =  2  intentos. 

2.  Cada  intento  resulta  en  uno  de  dos  resultados.  O  bien  la  pildora  es  generica 
(llame  “exito”  a  esto)  o  no  lo  es  (un  “fracaso”). 

3.  Como  las  pildoras  de  una  botella  de  receta  se  pueden  considerar  “mezcladas”  al 
azar,  la  probabilidad  incondicional  de  sacar  una  pildora  generica  en  un  intento 
determinado  serfa  2/20. 

4.  La  condition  de  independencia  entre  intentos  no  esta  satisfecha,  porque  la  pro¬ 
babilidad  de  sacar  una  pildora  generica  en  el  segundo  intento  depende  del  primer 
intento.  Por  ejemplo,  si  la  primera  pildora  sacada  es  generica  entonces  hay  solo 
una  pildora  generica  en  las  restantes  19.  Por  tanto, 

P(generica  en  intento  2|generica  en  intento  1)  =  1/19 


f  Aun  cuando  es  tradicional  que  los  dos  posibles  resultados  de  un  intento  se  denominen  “exito”  y  “fracaso”, 
podrfan  haberse  llamado  “cara”  y  “cruz”,  “rojo”  y  “bianco”  o  cualquier  otro  par  de  palabras.  En  consecuencia,  el 
resultado  llamado  “exito”  no  necesita  ser  visto  como  exito  en  el  uso  ordinario  de  la  palabra. 
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Si  la  primera  selection  no  resulta  en  una  plldora  generica,  entonces  hay  todavfa 
dos  pildoras  genericas  en  las  restantes  19,  y  la  probabilidad  de  un  “exito”  (una 
plldora  generica)  cambia  a 

AYgenerica  en  el  intento  2|no  generica  en  el  intento  1)  =  2/19 

Por  tanto,  los  intentos  son  dependientes  y  el  muestreo  no  representa  un  experi- 
mento  binomial. 


Considere  la  diferencia  entre  estos  dos  ejemplos.  Cuando  la  muestra  (los  n  intentos 
identicos)  vinieron  de  una  poblacion  grande,  la  probabilidad  de  exito  p  siguio  siendo  mas 
o  menos  la  misma  de  un  intento  a  otro.  Cuando  el  tamano  poblacional  N  era  pequeno,  la 
probabilidad  de  exito  p  cambio  en  forma  considerable  de  un  intento  a  otro,  y  el  experi- 
mento  no  fue  binomial. 


REGLA  PRACTICA 

Si  el  tamano  muestral  es  grande  con  respecto  al  tamano  poblacional,  en  particular  si 
n/N  s  .05,  entonces  el  experimento  resultante  no  es  binomial. 

En  el  capltulo  4,  tiramos  al  aire  dos  monedas  justas  y  construimos  la  distribution 
de  probabilidad  para  x,  el  numero  de  caras,  un  experimento  binomial  con  n  =  2  y 
p  =  .5.  La  distribution  binomial  general  de  probabilidad  se  construye  en  la  misma  forma, 
pero  el  procedimiento  se  complica  cuando  n  se  hace  grande.  Afortunadamente,  las  pro- 
babilidades  p(x)  siguen  un  modelo  general.  Esto  nos  permite  usar  una  sola  formula  para 
hallar  p(x)  para  cualquier  valor  dado  de  x. 


LA  DISTRIBUCION  BINOMIAL  DE  PROBABILIDAD 

Un  experimento  binomial  consta  de  n  intentos  identicos  con  probabilidad  p  de  exito 
en  cada  intento.  La  probabilidad  de  k  exitos  en  n  intentos  es 

r)/  _  i\  _  /~m  k  n—k  _  II !  k 

P(x  -k)  -  Ckpq  -  _  ky  p  q 

para  valores  de  k  =  0,  1,  2,  ...,  n.  El  sfmbolo  C"k  es  igual  a, 
n\ 

k\(n  —  k)\ 

donde  n\  =  n{n  —  1  ){n  —  2)  •  •  •  (2)(1)  y  0!  =  1. 

Las  formulas  generales  para  p,  a2  y  er  dadas  en  el  capitulo  4  se  pueden  usar  para  obte- 
ner  las  siguientes  formulas  mas  sencillas  para  la  media  y  desviacion  estandar  binomiales. 


MEDIA  Y  DESVIACION  ESTANDAR 

PARA  LA  VARIABLE  ALEATORIA  BINOMIAL 

La  variable  aleatoria  x,  el  numero  de  exitos  en  n  intentos,  tiene  una  distribution  de 
probabilidad  con  este  centra  y  dispersion: 


Media:  p 
Varianza:  a2 
Desviacion  estandar:  a 


np 

npq 

\inpq 
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EJEMPLO 


Encuentre  Fix  =  2)  para  una  variable  aleatoria  binomial  con  n  =  1 0  y  p  =  .1. 

Fix  =  2)  es  la  probabilidad  de  observar  2  exitos  y  8  fracasos  en  una 
secuencia  de  10  intentos.  Se  podrfan  observar  2  exitos  primero,  seguidos  de  8  fracasos 
consecutivos: 


CONSEJO 


n\  = 

n(n  —  1  )(n  —  2) . . .  (2)(1) 
Por  ejemplo, 

5!  =  5(4)(3)(2)(1)  =  120 
yO!  =  1. 


S,  S.  F.  F.  F,  F,  F,  F,  F,  F 

Como  p  es  la  probabilidad  de  exito  y  q  es  la  probabilidad  de  fracaso,  esta  secuencia 
particular  tambien  resulta  en  x  =  2  exitos. 

ppqqqqqqqq  =  p2q 8 

Sin  embargo,  pueden  tambien  resultar  muchas  otras  secuencias  en  x  =  2.  La  formula 
binomial  utiliza  C'n  para  contar  el  numero  de  secuencias  y  da  la  probabilidad  exacta 
cuando  se  usa  la  formula  binomial  con  k  =  2: 

P(x  =  2)  =  C2°(.l)2(.9)10“2 

=  2!U!T-^)!  C1)2('9)8  =  ^(-01X-430467)  =  .1937 


Se  podria  repetir  el  procedimiento  del  ejemplo  5.3  para  cada  valor  de  x  (0,  1,  2, 

10)  y  encontrar  todos  los  valores  de  p(x)  necesarios  para  construir  un  histograma  de  pro¬ 
babilidad  para  x.  Este  serfa  un  trabajo  largo  y  tedioso,  pero  la  grafica  resultante  se  verfa 
como  la  figura  5.1a).  Se  puede  verificar  la  altura  de  la  barra  para  x  =  2  y  encontrar  p(2) 
=  P(x  =  2)  =  .1937.  La  grafica  esta  sesgada  a  la  derecha;  esto  es,  casi  todo  el  tiempo 
se  observaran  valores  pequenos  de  x.  La  media  o  “punto  de  equilibrio”  esta  alrededor  de 
x  =  1 ;  de  hecho,  se  puede  usar  la  formula  para  hallar  la  media  exacta: 

p,  =  np  =  10(.l)  =  1 

Las  figuras  5.1b)  y  5.1c)  muestran  las  otras  dos  distribuciones  binomiales  con 
n  =  10  pero  con  diferentes  valores  de  /;.  Vea  las  formas  de  estas  distribuciones.  Cuan¬ 
do  p  =  .5,  la  distribucion  es  exactamente  simetrica  alrededor  de  la  media,  p  =  np 
=  10(.5)  =  5.  Cuando  p  =  .9,  la  distribucion  es  la  “imagen  espejo”  de  la  distribucion 
para  p  =  .  1  y  esta  sesgada  a  la  izquierda. 
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EJEMPLO 


En  un  tiempo  largo,  se  ha  observado  que  un  jugador  profesional  de  baloncesto  puede 
hacer  un  tiro  libre  en  un  intento  determinado  con  probabilidad  igual  a  .8.  Suponga  que 
el  lanza  cuatro  tiros  libres. 


1.  ^Cual  es  la  probabilidad  de  que  enceste  exactamente  dos  tiros  libres? 

2.  ^Cual  es  la  probabilidad  de  que  enceste  al  menos  un  tiro  libre? 


Solucion  Un  “intento”  es  un  solo  tiro  libre  y  se  puede  definir  un  “exito”  como  una 
canasta  y  un  “fracaso”  como  una  falla,  de  modo  que  n  =  4  y  p  =  .8.  Si  se  supone  que  la 
probabilidad  del  jugador  de  encestar  el  tiro  libre  no  cambia  de  un  tiro  a  otro,  entonces  el 
numero  x  de  veces  que  enceste  el  tiro  libre  es  una  variable  aleatoria  binomial. 


1.  P(x  =  2)  =  C42(.8)2(.2)2 


4! 

2!2! 


(.64)(.04) 


4(3)(2)(1) 

2(1)(2)(1) 


(.64)(.04)  =  .1536 


La  probabilidad  es  .1536  de  que  enceste  exactamente  dos  tiros  libres. 

2.  P(al  menos  uno)  =  P(x  >  1)  =  p(l)  +  p( 2)  +  p( 3)  +  p( 4) 

=  1  -  P(  0) 

=  1  -  Co(.8)°(.2)4 
=  1  -  .0016  =  .9984. 


Aun  cuando  se  podrfa  calcular  P(x  =  1),  Fix  =  2),  P(x  =  3)  y  P(x  =  4)  para 
hallar  esta  probabilidad,  usar  el  complemento  del  evento  hace  mas  facil  el  tra- 
bajo;  es  decir, 

P(x  >  1)  =  1  -  P(x  <  1)  =  1  -  P(x  =  0). 

£  Puede  usted  considerar  alguna  razon  por  la  que  su  suposicion  de  intentos  indepen- 
dientes  podrfa  ser  erronea?  Si  el  jugador  aprende  por  su  intento  previo  (es  decir,  ajusta 
su  tiro  de  acuerdo  con  su  ultimo  intento),  entonces  su  probabilidad  p  de  encestar  el  tiro 
libre  puede  cambiar,  posiblemente  aumentar,  de  un  tiro  a  otro.  Los  intentos  no  serian 
independientes  y  el  experimento  no  seria  binomial. 


Use  la  tabla  1  del  apendice  I 
mas  que  la  formula  binomial 
siempre  que  sea  posible.  Esta 
es  una  forma  mas  facil. 


Calcular  probabilidades  binomiales  puede  ser  tedioso  incluso  para  valores  relativa- 
mente  pequenos  de  n.  Cuando  n  se  hace  grande,  se  hace  casi  imposible  sin  ayuda  de 
una  calculadora  o  computadora.  Por  fortuna  tenemos  estas  dos  herramientas.  Las  tablas 
de  probabilidades  binomiales  acumulativas  generadas  por  computadora  se  dan  en  la 
tabla  1  del  apendice  I,  para  valores  de  n  que  van  de  2  a  25  y  para  valores  selecciona- 
dos  de  p.  Estas  probabilidades  tambien  pueden  ser  generadas  si  se  usa  el  MINITAB  o  los 
applets  Java  en  el  sitio  web  Premium. 

Las  probabilidades  binomiales  acumulativas  difieren  de  las  probabilidades  binomia¬ 
les  individuates  que  se  calcularon  con  la  formula  binomial.  Una  vez  que  usted  encuentre 
la  columna  de  probabilidades  para  los  valores  correctos  de  n  y  p  en  la  tabla  1 ,  el  renglon 
marcado  como  k  da  la  suma  de  todas  las  probabilidades  binomiales  de  x  =  0  a  x  =  k. 
La  tabla  5.1  muestra  parte  de  la  tabla  1  para  n  =  5  y  p  =  .6.  Si  se  muestra  en  el  renglon 
marcado  k  =  3,  se  encuentra 


P(x  <  3)  =  p( 0)  +  p(  1)  +  p( 2)  +  p( 3)  =  .663 
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tabla  5.1  Parte  de  la  tabla  1  del  apendice  I  para  n  =  5 


P 

k  .01  .05  .10  .20  .30  .40  .50  .60  .70  .80  .90  .95  .99  k 

0  —  —  —  —  —  —  —  .010  —  —  —  —  —  0 

1  —  —  —  —  —  —  —  .087  _____  1 

2  —  —  —  —  —  —  —  .317  _____  2 

3  —  —  —  —  —  —  —  .663  —  —  —  —  —  3 

4  —  —  —  —  —  —  —  .922  _____  4 

5  —  —  —  —  —  —  —  1.000  —  —  —  —  —  5 


Si  la  probabilidad  que  usted  necesite  calcular  no  esta  en  esta  forma,  necesitara  conside- 
rar  una  forma  para  reescribir  su  probabilidad  y  hacer  uso  de  las  tablas. 


EJEMPLO 


Use  la  tabla  binomial  acumulativa  para  n 
estos  eventos: 


5  y  p 


.6  para  hallar  las  probabilidades  de 


1 .  Exactamente  tres  exitos 

2.  Tres  o  mas  exitos 


Solucion 

1.  Si  encuentra  k  =  3  en  la  tabla  5.1,  el  valor  en  tabla  es 

P(x  <  3)  =  p(0)  +  77(1)  +  p( 2)  +  p( 3) 

Como  usted  desea  solo  P(x  =  3)  =  p{ 3),  debe  restar  la  probabilidad  no  deseada: 

P(x  <  2)  =  p(0)  +  p(l)  +  p(2) 

que  se  encuentra  en  la  tabla  5.1  con  k  =  2.  Entonces 

P{x  =  3)  =  P(x  <  3)  -  P(x  <  2) 

=  .663  -  .317  =  .346 

2.  Para  hallar  74 tres  o  mas  exitos)  =  P(x  >  3)  usando  la  tabla  5.1,  se  debe  usar  el 
complemento  del  evento  de  interes.  Escriba 

P{x  —  3)  —  1  P(x  <  3)  —  1  P{x  <  2) 

Se  puede  hallar  P(x  <  2)  en  la  tabla  5.1  con  k  =  2.  Entonces 

P(x  —  3)  —  1  P(x  <  2) 

=  1  -  .317  =  .683 
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binomiales? 

1.  Encuentre  los  valores  necesarios  deny  p.  Aisle  la  columna  apropiada  de  la  tabla  1. 

2.  La  tabla  1  da  P(x  <  k)  en  la  fila  marcada  k.  Reescriba  la  probabilidad  que  necesite 
para  que  este  en  esta  forma. 

•  Haga  una  lista  de  los  valores  de  x  en  su  evento. 

•  De  la  lista,  escriba  el  evento  como  la  diferencia  de  dos  probabilidades: 

P(x  <  a)  —  P(x  <  b)  para  a>  b 
o  el  complemento  del  evento: 

1  —  P(x  '  a) 

o  solo  el  evento  en  sf: 

P(x  ^  a)  o  P(x  <  a)  =  P(x  <  a  —  1) 

Repertorio  de  ejercicios 

A.  Considere  una  variable  aleatoria  binomial  con  n  =  5  y  p  =  .6.  Aisle  la  columna 
apropiada  en  la  tabla  1  y  llene  las  probabilidades  siguientes.  Una  de  las  probabili¬ 
dades,  P(x  <  3)  ya  esta  llena. 


K 

0 

1 

2 

3 

4 

5 

P(x  s  k) 

.663 

B.  Complete  los  espacios  en  bianco  en  la  tabla  siguiente.  El  segundo  problema  ya 
esta  hecho. 


El  problema 

Lista  de 
valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la 
probabilidad  (si 
es  necesario) 

Encuentre  la 
probabilidad 

4  o  menos 

4  o  mas 

4,5 

^0 

>< 

IV 

1  -  P[x  £  3) 

1  -  .663  =  .337 

Mas  de  4 

Menos  de  4 

Entre  2  y  4  (inclusive) 

Exactamente  4 

Informe  de  progreso 

•  ('  Todavfa  tiene  problemas?  Trate  de  nuevo  usando  el  repertorio  de  ejercicios 
del  final  de  esta  seccion. 

•  ;Ya  domina  las  probabilidades  binomiales?  Puede  saltarse  el  repertorio  de 
ejercicios  del  final  de  esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 


^  APPLET 

El  applet  Java  llamado  Calculating  Binomial  Probabilities  (Calculando  pro¬ 
babilidades  binomiales)  da  una  imagen  visual  de  la  distribucion  binomial  para 
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FIGURA  5.2 

Applet  Calculating 
Binomial  Probabilities 
(Calculando  probabilidades 
binomiales) 


valores  de  n  <  100  y  cualquier  p  que  usted  escoja.  Puede  usar  este  applet  para 
calcular  probabilidades  binomiales  para  cualquier  valor  de  x  o  para  cualquier 
intervalo  a  <  x  ^  b.  Para  reproducir  los  resultados  del  ejemplo  5.5,  teclee  5  en  la 
caja  marcada  “n”  y  0.6  en  la  caja  marcada  “p”,  presionando  la  tecla  “Enter”  des¬ 
pues  de  cada  entrada.  A  continuation  introduzca  los  valores  inicial  y  final  para  x 
(si  necesita  calcular  una  probabilidad  individual,  ambas  entradas  seran  iguales). 
La  probabilidad  se  calcula  y  queda  sombreada  en  rojo  en  su  pantalla  (azul  claro 
en  la  figura  5.2)  cuando  presiona  “Enter”.  Cual  es  la  probabilidad  de  tres  o  mas  exi- 
tos  de  la  figura  5.2?  <;Esto  confirma  nuestra  respuesta  del  ejemplo  5.5?  Usted  usara 
este  applet  de  nuevo  para  la  section  Mi  Applet  ejercicios  al  final  del  capltulo. 


Se  probo  un  regimen  formado  por  una  dosis  diaria  de  vitamina  C  para  determinar  su 
efectividad  para  prevenir  el  resfriado  comun.  Diez  personas  que  estuvieron  siguiendo  el 
regimen  prescrito  fueron  observadas  durante  un  ano.  Ocho  pasaron  el  invierno  sin  un  res¬ 
friado.  Suponga  que  la  probabilidad  de  pasar  el  invierno  sin  un  resfriado  es  .5  cuando  no 
se  sigue  el  regimen  de  vitamina  C.  Cual  es  la  probabilidad  de  observar  ocho  o  mas  sobre- 
vivientes,  dado  que  el  regimen  es  ineficiente  para  aumentar  la  resistencia  a  resfriados? 


Solution  Si  se  supone  que  el  regimen  de  vitamina  C  es  ineficiente,  entonces  la  pro¬ 
babilidad  p  de  sobrevivir  el  invierno  sin  un  resfriado  es  .5.  La  distribucion  de  probabili¬ 
dad  para  x,  el  numero  de  sobrevivientes,  es 

P(x)  =  ClX5)X5)w~x 

Usted  ya  ha  aprendido  cuatro  formas  de  hallar  P(8  o  mas  sobrevivientes)  =  P(x  >  8). 
Obtendra  los  mismos  resultados  con  cualquiera  de  los  cuatro;  escoja  el  metodo  mas 
comodo  para  su  problema  particular. 


1.  La  formula  binomial: 


P( 8  o  mas)  =  p( 8)  +  p( 9)  +  p(  10) 

=  C^ti)10  +  C‘,°(.  5)10  +  CTo(-5)10 
=  .055 


2.  Las  tablas  binomiales  acumulativas:  Encuentre  la  columna  correspondiente  a 
p  =  .5  en  la  tabla  para  n  =  10: 

P{ 8  o  mas)  =  P(x  >  8)  =  1  -  P{x  <  7) 

=  1  -  .945  =  .055 
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FIGURA  5.3 

Applet  Java  para  el 
ejemplo  5.6 


3.  El  applet  Calculating  Binomial  Probabilities  (Calculando  probabilidades 
binomiales):  Introduzca  n  =  10,  p  =  .5  y  calcule  la  probabilidad  de  que  x  sea 
entre  8  y  10.  La  probabilidad,  P(x  >  8)=  .0547,  esta  sombreado  en  rojo  en  su 
pantalla  (azul  claro  en  la  figura  5.3). 


0.3 


0.2 


0.1 


0.0 


n:  [TO 
PS 


0.5 


Start:  8 


End:  10 


4.  Salida  del  MINITAB:  La  salida  que  se  muestra  en  la  figura  5.4  da  la  funcion 

acumulativa  de  distribucion,  que  da  las  mismas  probabilidades  que  encontro  en 
las  tablas  acumulativas  binomiales.  La  funcion  de  densidad  de  probabilidad 
da  las  probabilidades  binomiales  individuales,  que  encontro  usted  usando  la 
formula  binomial. 


FIGURA  5.4 

Salida  del  MINITAB  para  el 
ejemplo  5.6 

x  p  (  x  <=  x 
0  0.00098 

1  0.01074 

2  0.05469 

3  0.17187 

4  0.37695 

5  0.62305 

6  0.82813 

7  0.94531 

8  0.98926 

9  0.99902 
10  1.00000 


Funcion  de  densidad  de  probabilidad 

Binomial  with  n  =  10  and  p  =  0.5 

x  P  (  X  =  x  ) 

0  0.000977 

1  0.009766 

2  0.043945 

3  0.117188 

4  0.205078 

5  0.246094 

6  0.205078 

7  0.117188 

8  0.043945 

9  0.009766 

10  0.000977 


Funcion  acumulativa  de  distribucion 

Binomial  with  n  =  10  and  p  =  0.5 
) 


Usando  la  funcion  acumulativa  de  distribucion,  calcule 

P(x  >  8)  =  1  -  P(x  <  7) 

=  1  -  .94531  =  .05469 

O  bien,  usando  la  funcion  de  densidad  de  probabilidad,  calcule 

P(x  >  8)  =  p{ 8)  +  p( 9)  +  p{  10) 

=  .043945  +  .009766  +  .000977  =  .05469 
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EJEMPLO 


Preferi r fa  usted  tomar  un  examen  de  option  multiple  o  uno  de  recordatorio  completo? 
Si  no  sabe  nada  del  material,  tendra  una  calificacion  de  cero  en  un  examen  de  recordato¬ 
rio  completo  pero,  si  le  dan  cinco  opciones  por  cada  pregunta,  jtiene  al  menos  una  pro- 
babilidad  en  cinco  de  adivinar  correctamente!  Si  un  examen  de  option  multiple  contiene 
100  preguntas,  cada  una  con  cinco  posibles  respuestas,  ^cual  es  la  calificacion  esperada 
para  un  estudiante  que  esta  adivinando  en  cada  pregunta?  ^Dentro  de  que  limites  caen 
las  calificaciones  de  “no  lo  sabe”? 


Solucion  Si  x  es  el  numero  de  respuestas  correctas  en  el  examen  de  100  preguntas, 
la  probabilidad  de  una  respuesta  correcta,  p,  es  una  en  cinco,  de  modo  que  p  =  .2.  Como 
el  estudiante  selecciona  respuestas  al  azar,  las  n  =  100  respuestas  son  independientes  y 
la  calificacion  esperada  para  esta  variable  aleatoria  binomial  es 

pt  =  np  =  100(.2)  =  20  respuestas  correctas 

Para  evaluar  la  dispersion  o  variabilidad  de  las  calificaciones,  se  puede  calcular 

er  =  \Jnpq  =  \j  100(.2)(.8)  =  4 

Entonces,  usando  su  conocimiento  de  variation  a  partir  del  teorema  de  Chebyshev  y  la 
Regia  empfrica,  puede  hacer  estos  enunciados: 

•  Una  gran  proportion  de  las  calificaciones  estara  a  no  mas  de  dos  desviaciones 
estandar  de  la  media,  o  sea  de  20  —  8  =  12  a  20  +  8  =  28. 

•  Casi  todas  las  calificaciones  estaran  a  no  mas  de  tres  desviaciones  estandar  de  la 
media,  o  sea  de  20  —  12  =  8  a  20  +  12  =  32. 


La  option  de  “adivinar”  da  al  estudiante  una  mejor  calificacion  que  una  de  cero  en  el 
examen  de  recordatorio  completo,  pero  el  estudiante  todavta  no  pasara  el  examen.  ^Que 
otras  opciones  tiene  el  estudiante? 


© 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  refieren  a  la  seccion  Mi  entrenador  personal  de  la  pagina  190. 

5.1  Considere  una  variable  aleatoria  binomial  con  n  =  8  y  p  =  .7.  Aisle  la  columna 
apropiada  en  la  tabla  1  y  llene  las  probabilidades. 


K 

0 

i 

2 

3 

4 

5 

6 

7 

8 

VI 

>< 

CL 

Llene  los  espacios  en  bianco  de  la  tabla  siguiente. 


El  problema 

Haga  una  lista 
de  valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la  probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

3  o  menos 

P(x< ) 

3  o  mas 

J2 

>< 

IV 

1  -  P(xs ) 

Mas  de  3 

P(x> ) 

1  -  P(xs ) 

Menos  de  3 

P(x< ) 

P(x< )  -  P(x=s ) 

Entre  3  y  5  (inclusive) 

P{ <1< ) 

P(x< ) 

Exactamente  3 

P(x= _ ) 

^2 

* 

IA 

1 

J2 

>< 

IA 
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5.2  Considere  una  variable  aleatoria  binomial  con  n  =  9  y  p  =  .3.  Separe  la  columna 
apropiada  de  la  tabla  1  y  llene  las  probabilidades  siguientes. 


K 

0 

i 

2 

3 

4 

5 

6 

7 

8 

VI 

>< 

CL 

Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 


El  problema 

Haga  una  lista 
de  valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la 
probabilidad 

Encuentre  la 
probabilidad 

Exactamente  2 

Mas  de  2 

2  o  mas 

Menos  de  2 

Entre  2  y  4  (inclusive) 

2  o  menos 

TECNICAS  BASICAS 

5.3  El  problema  de  la  urna  Un  frasco  contiene  cinco 
pelotas:  tres  rojas  y  dos  blancas.  Dos  pelotas  se  escogen 
al  azar  sin  restituirlas  (sin  devolverlas  al  frasco)  y  se 
registra  el  numero  x  de  pelotas  rojas.  Explique  por  que  x 
es  o  no  es  una  variable  aleatoria  binomial,  (sugerencia: 
Compare  las  caracterfsticas  de  este  experimento  con  las 
caracterfsticas  de  un  experimento  binomial  dado  en  esta 
seccion.)  Si  el  experimento  es  binomial,  de  los  valores  de 
ny  P- 

5.4  El  problema  de  la  urna,  continua  Consulte  el 
ejercicio  5.3.  Suponga  que  el  muestreo  fue  realizado  con 
restitucion.  Esto  es,  suponga  que  la  primera  pelota  se 
selecciono  del  frasco,  se  observo  y  luego  fue  restituida 
(vuelta  al  frasco),  y  que  las  pelotas  entonces  se  mezclaron 
antes  de  seleccionar  la  segunda  pelota.  Explique  por 

que  x,  el  numero  de  pelotas  rojas  observado,  es  o  no  es 
una  variable  aleatoria  binomial.  Si  el  experimento  es 
binomial,  de  los  valores  de  n  y  p. 

5.5  Evalue  estas  probabilidades  binomiales: 

a.  Cl(.3)2(.7)6  b.  C4o(.05)°(.95)4 

c.  C3°(.5)3(.5)7  d.  C7i(.2)‘(.8)6 

5.6  Evalue  estas  probabilidades  binomiales: 

a.  Co(.2)°(.8)8  b.  C’k^j'CS)7  c.  C82(.2)2(.8)6 

d.  P(x  <  1)  cuando  n  =  8,  p  =  .2 

e.  P(dos  exitos  o  menos) 

5.7  Sea  x  una  variable  aleatoria  binomial  con  n  =  7, 
p  =  .3.  Encuentre  estos  valores: 

a.  P(x  =  4)  b.  P(x  <  1)  c.  P(x  >  1) 

d.  p,  =  np  e.  cr  =  \Jnpq 


5.8  Use  la  formula  para  la  distribucion  binomial  de 
probabilidad  para  calcular  los  valores  de  p(x)  y  construya 
el  histograma  de  probabilidad  para  x  cuando  n  =  6  y 

p  =  .2.  [sugerencia:  Calcule  P(x  =  k)  para  siete  valores 
diferentes  de  k.] 

5.9  Consulte  el  ejercicio  5.8.  Construya  el  histograma 
de  probabilidad  para  una  variable  aleatoria  x  con  n  =  6  y 
p  =  .8.  Use  los  resultados  del  ejercicio  5.8;  no  calcule  de 
nuevo  todas  las  probabilidades. 

5.10  Si  x  tiene  una  distribucion  binomial  con  p  =  .5,  ('Ja 
forma  de  la  distribucion  de  probabilidad  sera  simetrica, 
sesgada  a  la  izquierda  o  sesgada  a  la  derecha? 

5.11  Sea  x  una  variable  aleatoria  binomial  con  n  =  10  y 
p  =  .4.  Encuentre  estos  valores: 

a.  P(x  =  4)  b.  P(x  >  4)  c.  P(x  >  4) 

d.  P(x  <4)  e.  pc  =  np  f.  a  =  \/npq 

5.12  Use  la  tabla  1  del  apendice  I  para  hallar  la  suma  de 
las  probabilidades  binomiales  dex  =  0a  x  =  k  para  estos 
casos: 

a.  n  =  10,  =  .1,  k  =  3 

b.  n  —  15,  p  =  .6,  k  =  7 

c.  n  =  25,  p  =  .5,  k  =  14 

5.13  Use  la  tabla  1  del  apendice  I  para  evaluar  las 

siguientes  probabilidades  para  n  =  6  y  p  =  .8: 

a.  P(x  &  4)  b.  P(x  =  2) 

c.  P(x  <  2)  d.  P(x  >  1 ) 

Verifique  estas  respuestas  usando  los  valores  de  p(x) 
calculados  en  el  ejercicio  5.9. 


www.FreeLibros.me 


5.2  LA  DISTFIBUCION  BINOMIAL  DE  PROBABILIDAD  O  195 


5.14  P(x  <  k)  en  cada  caso: 

a.  n  =  20,  p  =  .05,  k  =  2 

b.  n  =  15,  p  =  .7,  k  =  8 

c.  n  =  10, =  .9,  k  =  9 

5.15  Use  la  tabla  1  del  apendice  I  para  hallar  lo 
siguiente: 

a.  P(x  <  12)  para  n  =  20 ,p  =  .5 

b.  P(x  <  6)  para  /?  =  15,  p  =  .4 

c.  P(jc  >  4)  para  n  =  10,  p  =  .4 

d.  P( x  >  6)  para  n  =  15,  p  =  .6 

e.  P( 3  <  x  <  7)  para  n  =  10,  p  =  .5 

5.16  Encuentre  la  media  y  desviacion  estandar  para  una 
distribucion  binomial  con  estos  valores: 

a.  n  =  1000,/?  =  .3  b.  n  =  400,  p  =  .01 

c.  n  =  500,  p  =  .5  d.  n  =  1600,  p  =  .8 

5.17  Encuentre  la  media  y  desviacion  estandar  para  una 
distribucion  binomial  con  n  =  100  y  estos  valores  de  p: 

a.  p  =  .01  b.  p  =  .9  c.  p  =  .3 

d.  p  =  .7  e.  p  =  .5 

5.18  En  el  ejercicio  5.17,  la  media  y  desviacion  estandar 
para  una  variable  aleatoria  binomial  se  calcularon  para  un 
tarnano  muestral  fijo,  n  =  100  y  para  valores  diferentes 
de  p.  Grafique  los  valores  de  la  desviacion  estandar  para 
los  cinco  valores  de  p  dados  en  el  ejercicio  5.17.  0 Para 
que  valores  de  p  la  desviacion  estandar  parece  ser  un 
maximo? 

5.19  Sea  x  una  variable  aleatoria  binomial  con  n  =  20  y 
p  =  A. 

a.  Calcule  P(x  <  4)  usando  la  formula  binomial. 

b.  Calcule  P{x  <  4)  usando  la  tabla  1  del  apendice  I. 

c.  Use  la  salida  MINITAB  de  esta  pagina  para  calcular 
P(x  4).  Compare  los  resultados  de  los  incisos  a), 
b)  y  c). 

d.  Calcule  la  media  y  desviacion  estandar  de  la  variable 
aleatoria  x. 

e.  Use  los  resultados  del  inciso  d)  para  calcular  los 
intervalos  /r  ±  cr  p,  ±  2a,  y  p  ±  3cr.  Encuentre  la 
probabilidad  de  que  una  observacion  caiga  en  cada 
uno  de  estos  intervalos. 

f.  ,'Uos  resultados  del  inciso  e)  son  consistentes  con  el 
teorema  de  Chebyshev?  (iCon  la  Regia  emplrica?  (iPor 
que  si  o  por  que  no? 


Salida  MINITAB  para  el  ejercicio  5.19 
Funcion  de  densidad  de  probabilidad 

Binomial  with  n  =  20  and  p  =  0.1 
x  P(  X  =  x  ) 

0  0.121577 

1  0.270170 

2  0.285180 

3  0.190120 

4  0.089779 

5  0.031921 

6  0.008867 

7  0.001970 

8  0.000356 

9  0.000053 

10  0.000006 

11  0.000001 

12  0.000000 

13  0.000000 

14  0.000000 

15  0.000000 

16  0.000000 

17  0.000000 

18  0.000000 

19  0.000000 

20  0.000000 

APLICACIONES 

5.20  Clima  en  Chicago  Un  meteorologo  en  Chicago 
registro  el  numero  de  dlas  de  lluvia  durante  un  periodo 
de  30  dlas.  Si  la  variable  aleatoria  x  se  define  como 

el  numero  de  dlas  de  lluvia,  i x  tiene  una  distribucion 
binomial?  Si  no  es  asl,  ^por  que  no?  Si  es  asl,  (;se 
conocen  los  valores  de  n  y  de  pi 

5.21  felemercadeo  Una  empresa  de  investigacion 
de  mercado  contrata  operadores  para  realizar  encuestas 
por  telefono.  La  computadora  marca  al  azar  un  numero 
telefonico  y  la  operadora  pregunta  a  quien  conteste  si 
tiene  tiempo  para  contestar  algunas  preguntas.  Sea  x  el 
numero  de  llamadas  telefonicas  hechas  hasta  que  el  primer 
entrevistado  esta  dispuesto  a  contestar  las  preguntas  de  la 
operadora.  ^Es  este  un  experimento  binomial?  Explique. 

5.22  Calificaciones  del  SAT  (examen  de  aptitud 
escolar)  En  2006,  el  promedio  combinado  de 
calificaciones  del  SAT  (lectura  +  verbal  +  escritura)  para 
estudiantes  que  van  hacia  la  universidad  en  Estados  Unidos 
fue  1518  (de  2400).  Suponga  que  aproximadamente  45% 
de  todos  los  graduados  de  preparatoria  toman  este  examen 
y  que  100  son  seleccionados  al  azar  en  todo  Estados 
Unidos.1  /Cual  de  las  siguientes  variables  aleatorias  tiene 
una  distribucion  binomial  aproximada?  Si  es  posible,  de 
los  valores  para  n  y  p. 

a.  El  numero  de  estudiantes  que  tomaron  el  SAT. 

b.  Las  calificaciones  de  los  100  estudiantes  en  el  SAT. 
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c.  El  numero  de  estudiantes  que  calificaron  arriba  del 
promedio  del  SAT. 

d.  El  tiempo  que  tomo  a  cada  estudiante  para  completar 
el  SAT. 

5.23  Sistemas  de  seguridad  El  sistema  de 
seguridad  de  una  casa  esta  disenado  para  tener  un  99% 
de  confiabilidad.  Suponga  que  nueve  casas  equipadas  con 
este  sistema  experimentan  un  intento  de  robo.  Encuentre 
las  probabilidades  de  estos  eventos: 

a.  A1  menos  una  de  las  alarmas  se  activo. 

b.  Mas  de  siete  de  las  alarmas  se  activaron. 

c.  Ocho  o  menos  alarmas  se  activaron. 

5.24  Tipos  de  sangre  En  cierta  poblacion,  85%  de 
las  personas  tienen  tipo  de  sangre  Rh  positivo.  Suponga 
que  dos  personas  de  esta  poblacion  se  casan.  ^Cual  es  la 
probabilidad  de  que  ambos  tengan  Rh  negativo,  lo  cual 
hace  inevitable  que  sus  hijos  tengan  Rh  negativo? 

5.25  Colores  de  autos  La  preferencia  por  el 
color  de  un  auto  cambia  con  los  anos  y  de  acuerdo  al 
modelo  particular  que  seleccione  el  cliente.  En  un  ano 
reciente,  suponga  que  10%  de  todos  los  autos  de  lujo 
que  se  vendieron  eran  negros.  Si  125  autos  de  ese  ano 
y  tipo  se  seleccionan  al  azar,  encuentre  las  siguientes 
probabilidades: 

a.  Al  menos  cinco  autos  son  negros. 

b.  A  lo  sumo  seis  autos  son  negros. 

c.  Mas  de  cuatro  autos  son  negros. 

d.  Exactamente  cuatro  autos  son  negros. 

e.  Entre  tres  y  cinco  autos  (inclusive)  son  negros. 

f.  Mas  de  20  autos  no  son  negros. 

5.26  Harry  Potter  De  todos  los  libros  de  Harry 
Potter  comprados  en  un  ano  reciente,  alrededor  del  60% 
fueron  comprados  por  lectores  de  14  anos  de  edad  o 
mas.2  Si  se  entrevista  a  12  aficionados  de  Harry  Potter 
que  compraron  libros  ese  ano  y  si  p  =  .6,  encuentre  las 
siguientes  probabilidades. 


a.  Al  menos  cinco  de  ellos  tenfan  14  anos  o  mas. 

b.  Exactamente  nueve  de  ellos  tenfan  14  anos  o  mas. 

c.  Menos  de  tres  de  ellos  tenfan  14  anos  o  mas. 


5.27  Cuentas  del  medico  Unos  registros  muestran 
que  30%  de  todos  los  pacientes  ingresados  en  una  clfnica 
medica  no  pagan  sus  cuentas  y  que,  en  ultima  instancia, 
esas  cuentas  son  olvidadas.  Suponga  que  n  =  4  nuevos 
pacientes  representan  una  seleccion  aleatoria  de  entre  un 
gran  conjunto  de  prospectos  de  pacientes  atendidos  por  la 
clfnica.  Encuentre  estas  probabilidades: 

a.  Las  cuentas  de  todos  los  pacientes  tendran  finalmente 
que  olvidarse. 

b.  Una  tendra  que  olvidarse. 

c.  Ninguna  tendra  que  olvidarse. 

5.28  Cuentas  del  medico  I  Considere  el  problema 
de  pagos  al  medico  del  ejercicio  5.27  en  un  escenario  mas 
realista.  De  todos  los  pacientes  ingresados  a  una  clfnica 
medica,  30%  no  pagan  sus  cuentas  y  las  deudas  finalmente 
se  olvidan.  Si  la  clfnica  trata  2000  pacientes  diferentes 

en  un  periodo  de  un  ano,  ^cual  es  el  numero  medio 
(esperado)  de  deudas  que  tienen  que  olvidarse?  Si  x  es  el 
numero  de  deudas  olvidadas  del  grupo  de  2000  pacientes, 
encuentre  la  varianza  y  desviacion  estandar  de  x.  (',Quc 
se  puede  decir  acerca  de  la  probabilidad  de  que  x  pase  de 
700?  (sugerencia:  Use  los  valores  de  /x  y  cr,  junto  con  el 
teorema  de  Chebyshev,  para  contestar  esta  pregunta.) 

5.29  Infestacion  de  la  mosca  blanca  Suponga  que 
10%  de  los  campos  en  una  region  agrfcola  determinada 
estan  infestados  con  la  mosca  blanca  de  la  remolacha.  Se 
seleccionan  100  campos  de  esta  region  y  se  inspeccionan 
para  ver  si  estan  infestados. 

a.  ^Cual  es  el  numero  promedio  de  campos  muestreados 
que  estan  infestados  de  la  mosca  blanca? 

b.  ^Dentro  de  que  lfmites  esperarfa  usted  hallar  el 
numero  de  campos  infestados,  con  probabilidad 
aproximada  de  95  %? 

c.  ^Que  podrfa  usted  concluir  si  encuentra  que  x  =  25 
campos  estuvieran  infestados?  /,Es  posible  que  una  de 
las  caracterfsticas  de  un  experimento  binomial  no  se 
satisfaga  en  este  experimento?  Explique. 

5.30  Preferencias  de  color  en  ratones  En  un 

experimento  de  psicologfa,  la  investigadora  planea  probar 
la  preferencia  de  color  en  ratones  bajo  ciertas  condiciones 
experimentales.  Ella  disena  un  laberinto  en  el  que  el 
raton  debe  escoger  uno  de  dos  caminos,  en  color  ya  sea 
rojo  o  azul,  en  cada  uno  de  10  cruceros.  Al  final  del 
laberinto,  el  raton  recibe  una  recompensa  en  alimento. 

La  investigadora  cuenta  el  numero  de  veces  que  el  raton 
escoge  el  camino  rojo.  Si  usted  fuera  la  investigadora, 
^como  usarfa  esta  cuenta  para  determinar  si  el  raton  tiene 
alguna  preferencia  por  un  color? 

5.31  Dolor  de  espalda  Seis  de  cada  10  personas 
adultas  dicen  que  el  dolor  de  la  espalda  baja  limita  en 
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forma  considerable  sus  actividades  atleticas.3  A  una 
muestra  al  azar  de  n  =  8  adultos  se  les  pregunto  si  el 
dolor  de  la  espalda  baja  limita  en  forma  considerable 
sus  actividades  atleticas.  La  salida  impresa  del  MINITAB 
muestra  las  probabilidades  acumulativas  e  individuales. 

Salida  impresa  del  MINITAB  para  el  ejercicio  5.31 

Funcion  acumulativa  Funcion  de  densidad 

de  distribucion  de  probabilidad 

Binomial  with  n  =  8  Binomial  with  n  =  8 


and 

p 

=  0.6 

and 

p  =  0.6 

X 

p< 

X  <=  x  ) 

X 

P(  X  =  x  ) 

0 

0 . 00066 

0 

0 . 000655 

1 

0 . 00852 

1 

0 . 007864 

2 

0 . 04981 

2 

0 . 041288 

3 

0 . 17367 

3 

0.123863 

4 

0.40591 

4 

0.232243 

5 

0 .68461 

5 

0.278692 

6 

0 . 89362 

6 

0 .209019 

7 

0 . 98320 

7 

0 . 089580 

8 

1 . 00000 

8 

0 . 016796 

a.  Use  la  formula  binomial  para  hallar  la  probabilidad  de 
que  los  ocho  indiquen  que  el  dolor  de  la  espalda  baja 
era  un  factor  limitante  en  sus  actividades  atleticas. 

b.  Confirme  los  resultados  del  inciso  (a)  usando  la  salida 
impresa  del  MINITAB. 

c.  ('Cual  es  la  probabilidad  de  que  a  los  sumo  siete 
individuos  digan  que  el  dolor  de  la  espalda  baja  es 
un  factor  limitante  en  sus  actividades  atleticas? 

5.32  Comida  rapida  y  gasolineras  40%  de  los 

estadounidenses  que  viajan  en  auto  buscan  gasolineras 
y  mercados  de  alimentos  que  sean  cercanos  o  visibles 
desde  la  carretera.  Suponga  que  a  una  muestra  aleato- 
ria  de  n  =  25  estadounidenses  que  viajan  en  auto  se 
les  pregunta  como  determinan  donde  detenerse  para 
tomar  alimentos  y  cargar  gasolina.  Sea  x  el  numero 
de  la  muestra  que  responden  que  buscan  gasolineras 


y  mercados  de  alimentos  que  sean  cercanos  o  visibles 
desde  la  carretera. 

a.  (\Cu ales  son  la  media  y  varianza  de  x? 

b.  Calcule  el  intervalo  /x  ±  2cr.  (-,Cu riles  valores  de  la 
variable  aleatoria  binomial  x  caen  en  este  intervalo? 

c.  Encuentre  P( 6  <  x  <  14).  (  Cxi mo  se  compara  esto 
con  la  fraccion  del  intervalo  /x  ±  2 it  para  cualquier 
distribucion?  para  distribuciones  en  forma  de 
montrculo? 

5.33  Prueba  del  gusto  por  el  PTC  La  prueba  del 
gusto  por  el  PTC  (feniltiocarbamida)  es  un  ejercicio 
favorito  para  toda  clase  de  genetica  humana.  Se  ha 
establecido  que  un  solo  gen  determina  la  caracterrstica 
y  que  70%  de  los  estadounidenses  son  “probadores”, 
en  tanto  que  30%  son  “no  probadores”.  Suponga  que  se 
escogen  20  estadounidenses  y  se  someten  a  la  prueba  del 
gusto  del  PTC. 

a.  (\CuriI  es  la  probabilidad  de  que  17  o  mas  sean 
“probadores”? 

b.  ((Curil  es  la  probabilidad  de  que  15  o  menos  sean 
“probadores”? 

5.34  El  mejor  amigo  del  hombre  Segun  la 
Sociedad  protectora  de  animales  de  Estados  Unidos,  hay 
aproximadamente  65  millones  de  perros  con  dueno  en 
Estados  Unidos  y  alrededor  del  40%  de  todas  las  familias 
en  Estados  Unidos  tienen  al  menos  un  perro.4  Suponga 
que  la  cifra  del  40%  es  correcta  y  que  15  familias  se 
seleccionan  al  azar  para  un  estudio  sobre  propiedad  de 
mascotas. 

a.  (',CuriI  es  la  probabilidad  de  que  exactamente  ocho  de 
las  familias  tenga  al  menos  un  perro? 

b.  ('  Cxiri I  es  la  probabilidad  de  que  al  menos  cuatro  de  las 
familias  tenga  al  menos  un  perro? 

c.  (.Cual  es  la  probabilidad  de  que  mas  de  10  familias 
tenga  al  menos  un  perro? 


LA  DISTRIBUCION  DE  PROBABILIDAD 
DE  POISSON 

Otra  variable  aleatoria  discreta  que  tiene  numerosas  aplicaciones  practicas  es  la  variable 
aleatoria  de  Poisson.  Su  distribucion  de  probabilidad  da  un  buen  modelo  para  datos  que 
representa  el  numero  de  sucesos  de  un  evento  especificado  en  una  unidad  determinada 
de  tiempo  o  espacio.  A  continuacion  veamos  algunos  ejemplos  de  experimentos  para  los 
cuales  la  variable  aleatoria  x  puede  ser  modelada  por  la  variable  aleatoria  de  Poisson: 


•  El  numero  de  llamadas  recibidas  por  un  conmutador  durante  un  tiempo  determi- 
nado 

•  El  numero  de  bacterias  por  volumen  pequeno  de  fluido 

•  El  numero  de  llegadas  de  clientes  al  mostrador  de  una  caja  de  pago  en  un  minuto 
determinado 
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•  El  numero  de  descomposturas  de  una  maquina  durante  un  dfa  determinado 

•  El  numero  de  accidentes  de  transito  en  un  crucero  dado  durante  un  tiempo  deter¬ 
minado 

En  cada  uno  de  estos  ejemplos,  jc  represents  el  numero  de  eventos  que  ocurren  en 
un  periodo  o  espacio,  durante  el  cual  se  puede  esperar  que  ocurra  un  promedio  de 
fx  de  estos  eventos.  Las  iinicas  suposiciones  necesarias,  cuando  uno  usa  la  distribucion 
de  Poisson  para  modelar  experimentos  tales  como  estos,  son  que  las  cuentas  o  eventos 
ocurren  al  azar  e  independientemente  unos  de  otros.  La  formula  para  la  distribucion  de 
probabilidad  de  Poisson,  asf  como  su  media  y  varianza,  se  dan  a  continuacion. 


LA  DISTRIBUCION  DE  PROBABILIDAD  DE  POISSON 

Sea  n  el  numero  promedio  de  veces  que  ocurre  un  evento  en  cierto  tiempo  o  espa¬ 
cio.  La  probabilidad  de  k  sucesos  de  este  evento  es 

P(x  =  k)  = 

para  valores  de  k  =  0,  1 ,  2,  3,  ....  La  media  y  desviacion  estandar  de  la  variable 
aleatoria  de  Poisson  x  son 

Media:  /x 

Desviacion  estandar:  er  =  \kfx 


Utilice  la  formula  Poisson 
o  la  tabla  2  para  calcular 
probabilidades  de  Poisson. 


El  sfmbolo  e=  2.71828. . .  se  evalua  usando  su  calculadora  cientifica,  que  debe  tener  una 
funcion  como  e  .  Para  cada  valor  de  k,  se  pueden  obtener  las  probabilidades  individuals 
para  la  variable  aleatoria  de  Poisson,  igual  que  como  hicimos  para  la  variable  aleatoria 
binomial. 

Alternativamente,  se  pueden  usar  tablas  acumulativas  de  Poisson  (tabla  2  del  apen- 
dice  I)  o  probabilidades  acumulativas  o  individuals  generadas  por  el  MINITAB.  Estas 
dos  opciones  son  por  lo  general  mas  comodas  que  hacer  el  calculo  manualmente.  Los 
procedimientos  son  semejantes  a  los  empleados  para  la  variable  aleatoria  binomial. 


la  formula? 

1 .  Encuentre  el  valor  necesario  de  fx. 

2.  Haga  una  lista  de  valores  de  x  en  su  evento. 

3.  Para  cada  valor  de  x,  sustituya  x  =  k  en  la  formula,  P(x  =  k)  =  — . 

4.  Sume  las  probabilidades  individuales  en  (3)  para  hallar  la  probabilidad  de  interes. 


Repertorio  de  ejercicios 

A.  Considere  una  variable  aleatoria  de  Poisson  con  /x  =  1.5.  Calcule  las  siguientes 


probabilidades  usando  la  tabla  siguiente: 


Probabilidad 

Formula 

Valor  calculado 

P(x=  0) 

/xV1* 

k\ 

P[x=  1) 

k\ 

P(1  o  menos  exitos) 

P(x  = _ )  +  P(x  = _ ) 
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i,C6mo  uso  la  tabla  2  para  calcular  probabilidades 
de  Poisson? 

1.  Encuentre  el  valor  necesario  de  /x.  Aisle  la  columna  apropiada  de  la  tabla  2. 

2.  La  tabla  2  da  P(x  <  k)  en  el  renglon  marcado  k.  Reescriba  la  probabilidad  que 
necesita  para  que  este  en  esta  forma. 

•  Haga  una  lista  de  los  valores  de  x  en  su  evento. 

•  De  la  lista,  escriba  el  evento  como  la  diferencia  de  dos  probabilidades: 

P(x  <  a)  —  P(x  <  b)  para  a>  b 
o  el  complemento  del  evento: 


1  —  P(x  -  a) 

o  solo  el  evento  mismo: 

P(x  <  a)  o  P(x  <  a)  =  P{x  <  a  —  1) 

Repertorio  de  ejercicios 

B.  Considere  una  variable  aleatoria  de  Poisson  con  fx  =  1.5.  Separe  la  columna 
apropiada  en  la  tabla  2  y  llene  las  probabilidades  siguientes.  Una  de  las  probabili¬ 
dades,  P(x  <  3),  ya  esta  llenada. 


K 

0 

1 

2 

3 

4 

5 

6 

7 

P(x  £  K) 

.934 

C.  Llene  los  espacios  en  bianco  en  la  tabla  siguiente.  El  tercer  problema  ya  esta 
hecho. 


El  problema 

Lista  de 
valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la 
probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

3  o  menos 

3  o  mas 

Mas  de  3 

CO 

VI 

>< 

a. 

1 

Menos  de  3 

Entre  2  y  4  (inclusive) 

Exactamente  3 

Informe  de  progreso 

•  /  Todavfa  tiene  problemas?  Trate  de  nuevo  usando  el  repertorio  de  ejercicios 
del  final  de  esta  seccion. 

•  ;Ya  domina  las  probabilidades  binomiales?  Puede  saltarse  el  repertorio  de 
ejercicios  del  final  de  esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 


Una  vez  calculados  los  valores  para  p(x),  puede  usted  usarlos  para  construir  un  histo- 
grama  de  probabilidad  para  la  variable  aleatoria  x.  En  la  figura  5.5  se  presentan  graficas 
de  la  distribucion  de  probabilidad  de  Poisson  para  fx  =  .5,  1  y  4. 
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FIGURA  5.5 

Distribuciones  de 
probabilidad  de  Poisson 
para  /u,  =  .5, 1  y4 


p(x) 

pix) 

.60 

.60 

.50 

.50 

pi  =  .5 

4=1 

.40 

.40 

.30 

.30 

.20 

.20 

— 

.10 

.10 

III  n 

i 

0 

0 

1 

2  3  4  x 

0  1 

2 

3  4 

J  I  L 


pix) 

.20 

.15 

.10 

.05 

0 


d  L 


J  I  I  L 


pr  =  4 


J  I  I  L 


10  11 


El  numero  promedio  de  accidentes  de  transito  en  cierto  crucero  de  carretera  es  dos  por 
semana.  Suponga  que  el  numero  de  accidentes  sigue  una  distribucion  de  Poisson  con 
fJL  =  2. 

1 .  Encuentre  la  probabilidad  de  que  no  haya  accidentes  en  este  crucero  de  carretera 
durante  un  periodo  de  1  semana. 

2.  Encuentre  la  probabilidad  de  que  a  lo  sumo  haya  tres  accidentes  en  esta  seccion 
de  carretera  durante  un  periodo  de  2  semanas. 

Solucion 

1.  El  numero  promedio  de  accidentes  por  semana  es  p.  =  2.  Por  tanto,  la  probabi¬ 
lidad  de  que  no  haya  accidentes  en  esta  seccion  de  carretera  durante  1  semana 
determinada  es 

P(x  =  0)  =  pi  0)  =  =  e~2  =  .13533 

2.  Durante  un  periodo  de  2  semanas,  el  numero  promedio  de  accidentes  en  esta 
seccion  de  carretera  es  2(2)  =  4.  La  probabilidad  de  que  a  lo  sumo  haya  tres  acci¬ 
dentes  durante  un  periodo  de  2  semanas  es 


P(x  <  3)  =  p{ 0)  +  p(  1)  +  pi 2)  +  p{ 3) 
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donde 

p( 0)  =  =  .018316  p( 2)  =  =  .146525 

p(  1)  =  =  .073263  p{ 3)  =  ^p  =  .195367 

Por  tanto, 

P(x  <  3)  =  .018316  +  .073263  +  .146525  +  .195367  =  .433471 

Este  valor  podrfa  leerse  directamente  de  la  tabla  2  del  apendice  I,  indicando  p  =  4  y 
k  =  3,  como  P(x  <  3)  =  .433. 


En  la  seccion  5.2,  utilizamos  las  tablas  binomiales  acumulativas  para  simplilicar 
el  calculo  de  probabilidades  binomiales.  Desafortunadamente,  en  situaciones  practicas, 
con  frecuencia  n  es  grande  y  no  se  dispone  de  tablas. 


Se  puede  estimar 


probabilidades  binomiales 
con  la  de  Poisson  cuando  n 
es  grande  y  p  es  pequena. 


EJEMPLO 


LA  APROXIMACION  DE  POISSON  A  LA  DISTRIBUCION 
BINOMIAL 

La  distribucion  de  probabilidad  de  Poisson  da  una  aproximacion  sencilla,  facil  de 
calcular  y  precisa  a  probabilidades  binomiales  cuando  n  es  grande  y  p  =  np  es 
pequena,  de  preferencia  con  np  <  7.  Una  aproximacion  apropiada  para  valores  mas 
grandes  de  p  =  np  se  da  en  el  capitulo  6. 

Suponga  que  una  compama  de  seguros  de  vida  asegura  las  vidas  de  5000  hombres  de 
42  anos  de  edad.  Si  estudios  actuariales  muestran  que  la  probabilidad  de  que  cualquier 
hombre  de  42  anos  muera  en  un  ano  determinado  es  .001,  encuentre  la  probabilidad 
exacta  de  que  la  companfa  tendra  que  pagar  x  =  4  reclamaciones  durante  un  ano  deter¬ 
minado. 


Solucion  La  probabilidad  exacta  esta  dada  por  la  distribucion  binomial  como 
P(x  =  4)  =  p(  4)  =  -^MT(.ooi)4(.999)4"6 

para  la  cual  no  se  dispone  de  tablas  binomiales.  Calcular  P(x  =  4)  sin  ayuda  de  una 
computadora  serfa  muy  lento,  pero  la  distribucion  de  Poisson  se  puede  usar  para  dar 
una  buena  aproximacion  para  P(x  =  4).  Calculando  p  =  np  =  (5000)(.001)  =  5  y  susti- 
tuyendo  en  la  formula  para  la  distribucion  de  probabilidad  de  Poisson,  tenemos 

/rV"  5  V5  (625X.006738) 

PCU  4|  24  •1/:> 


El  valor  de  p{A)  podrfa  obtenerse  tambien  usando  la  tabla  2  del  apendice  I  con  p  =  5 
como 


p( 4)  =  P(x  <  4)  -  P(x  <  3)  =  .440  -  .265  =  .175 


Una  fabricante  de  podadoras  para  el  pasto  compra  motores  de  1  hp  y  2  ciclos,  en  lotes 
de  1000,  a  un  proveedor.  Ella  entonces  equipa  cada  una  de  las  podadoras  producidas 
por  su  planta  con  uno  de  los  motores.  La  historia  muestra  que  la  probabilidad  de  que 
cualquier  motor  del  proveedor  resulte  no  satisfactorio  es  .001.  En  un  embarque  de  1000 
motores,  ^cual  es  la  probabilidad  de  que  ninguno  sea  defectuoso?  H ay  tres  o  mas?  ^Hay 
cuatro? 
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Este  es  un  experimento  binomial  con  n  =  1000  y  p  =  .001.  El  numero 
esperado  de  mot  ores  defectuosos  en  un  embarque  de  n  =  1000  mot  ores  es  p.  =  np  = 
(1000)(.001)  =  1.  Como  este  es  un  experimento  binomial  con  np  <  7,  la  probabilidad 
de  x  motores  defectuosos  en  este  embarque  puede  aproximarse  con 


P(x  =  k)  =  p(k ) 


■tk  -1  -1 

1  e  e _ 

k\  k\ 


Por  tanto. 


P(0)  -  %-  = 


pi  3)  -  jr  = 


P(4)  “  4T 


.368 

1 

.368 

6 

.368 

24 


.368 

.061 

.015 


Las  probabilidades  individuales  de  Poisson  para  p,  =  1,  junto  con  las  probabilidades 
binomiales  individuales  para  n  =  1000  y  p  =  .001,  fueron  generadas  por  MINITAB  y  se 
muestran  en  la  figura  5.6.  Las  probabilidades  individuales,  aun  cuando  se  calculan  con 
formulas  totalmente  diferentes,  son  casi  iguales.  Las  probabilidades  binomiales  exactas 
estan  en  la  seccion  izquierda  de  la  figura  5.6,  y  las  aproximaciones  Poisson  estan  a  la 
derecha.  Observe  que  el  MINITAB  deja  de  calcular  probabilidades  una  vez  que  el  valor 
sea  igual  a  cero  dentro  de  un  nivel  de  precision  asignado  previamente. 


FIGURA  5.6 

Salida  impresa 
del  MINITAB  de 
probabilidades  binomiales 
y  de  Poisson 


Funcion  de  densidad  Funcion  de  densidad 

de  probabilidad  de  probabilidad 

Binomial  with  n  =  1000  and  p  =  0.001  Poisson  with  mean  =  1 
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EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  refieren  a  la  seccion  Ml  entrenador  personal  de  la  paglna  198. 

5.35  Considere  una  variable  aleatoria  de  Poisson  con  p,  =  2.5.  Calcule  las  siguientes 
probabilidades  con  la  tabla  siguiente. 
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Probabilidad 

Formula 

Valor  calculado 

O 

II 

CL 

k\ 

P(x=  1) 

k\ 

cvi 

II 

>< 

CL 

/iV' 

k\ 

P(2  o  menos  exitos) 

P(x  = _ )  +  P{x  = _ )  +  P(x  = _ ) 

5.36  Considere  una  variable  aleatoria  de  Poisson  con  /x  =  3.  Calcule  las  siguientes 
probabilidades  con  la  tabla  siguiente. 


Probabilidad 

Formula 

Valor  calculado 

O 

II 

CL 

/iV" 

k\ 

P(x=  1) 

k\ 

P(mas  de  1  exito) 

1  -[P(x= _ )  +  P(x  — _ .)] 

5.37  Considere  una  variable  aleatoria  de  Poisson  con  /x  =  3.  Separe  la  columna  apropiada 
en  la  tabla  2  y  llene  las  probabilidades  siguientes. 


K 

0 

i 

2 

3 

4 

5 

6 

7 

8 

9 

10 

VI 

>< 

CL 

Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 


El  problema 

Lista  de 
valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la  probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

3  o  menos 

j 

>< 

CL 

3  o  mas 

^3 

* 

IV 

1  -  P(x< ) 

Mas  de  3 

P(x> ) 

1  -  P(x< ) 

Menos  de  3 

P(x< ) 

v) 

CL 

Entre  3  y  5  (inclusive) 

P( <x< ) 

P(x< )  -  P(x< ) 

Exactamente  3 

P(x  — _ ) 

^2 

>< 

IA 

1 

>< 

IA 

5.38  Considere  una  variable  aleatoria  de  Poisson  con  /x  =  0.8.  Separe  la  columna 
apropiada  en  la  tabla  2  y  llene  las  probabilidades  siguientes. 


K 

0 

i 

2 

3 

4 

5 

ie: 

VI 

>< 

CL 
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Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 


El  problema 

Lista  de 
valores  de  x 

Escriba  la  proba¬ 
bilidad 

Reescriba  la  probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

Exactamente  2 

Mas  de  2 

2  o  mas 

Menos  de  2 

Entre  2  y  4  (inclusive) 

2  o  menos 

TECNICAS  BASICAS 

5.39  Sea  x  una  variable  aleatoria  de  Poisson  con  media 
fx  =  2.  Calcule  estas  probabilidades: 

a.  P(x  =  0)  b.  P( x  =  1) 

c.  P(x  >1)  d.  P(x  =  5) 

5.40  Sea  x  una  variable  aleatoria  de  Poisson  con  media 
At  =  2.5.  Use  la  tabla  2  del  apendice  I  para  calcular  estas 
probabilidades: 

a.  P(x  s  5)  b.  P(x  <  6) 

c.  P{x  —  2)  d.  P(l<x<4) 

5.41  Poisson  us.  binomial  Sea  x  una  variable 
aleatoria  con  n  =  20  y  p  =  .  1 . 

a.  Calcule  P(x  <  2)  usando  la  tabla  1  del  apendice  I  para 
obtener  la  probabilidad  binomial  exacta. 

b.  Use  la  aproximacion  de  Poisson  para  calcular 
Pix  <  2). 

c.  Compare  los  resultados  de  los  incisos  a)  y  b).  ^Es 
precisa  la  aproximacion? 

5.42  Poisson  vs  binomial  II  Para  ilustrar  que  tan 
bien  la  distribucion  de  probabilidad  de  Poisson  aproxima 
la  distribucion  binomial  de  probabilidad,  calcule  los 
valores  aproximados  de  Poisson  para p( 0)  y  p(\)  para 
una  distribucion  binomial  de  probabilidad  con  n  =  25  y 
p  =  .05.  Compare  las  respuestas  contra  los  valores 
exactos  obtenidos  de  la  tabla  1  del  apendice  I. 

APLICACIONES 

5.43  Seguridad  en  un  aeropuerto  El  mayor 
numero  de  pequenos  aviones  de  vuelos  cortos  en 
aeropuertos  importantes  ha  aumentado  la  preocupacion 
por  la  seguridad  en  el  aire.  Un  aeropuerto  de  la  region 
este  ha  registrado  un  promedio  mensual  de  cinco 
accidentes  que  casi  ocurren  en  aterrizajes  y  despegues 
en  los  ultimos  5  anos. 

a.  Encuentre  la  probabilidad  de  que  durante  un  mes 
determinado  no  haya  accidentes  que  casi  ocurren  en 
aterrizajes  y  despegues  en  el  aeropuerto. 


b.  Encuentre  la  probabilidad  de  que  durante  un  mes 
determinado  haya  cinco  accidentes  que  casi  ocurren. 

c.  Encuentre  la  probabilidad  de  que  haya  al  menos  cinco 
accidentes  que  casi  ocurren  durante  un  mes  particular. 

5.44  Cuidados  intensivos  El  numero  x  de  personas 
ingresadas  a  una  unidad  de  cuidados  intensivos  en  un 
hospital  particular,  en  un  dfa,  tiene  una  distribucion  de 
probabilidad  de  Poisson  con  media  igual  a  cinco  personas 
por  dfa. 

a.  a Qi  til  es  la  probabilidad  de  que  el  numero  de  personas 
ingresadas  a  una  unidad  de  cuidados  intensivos  en 

un  hospital  particular,  en  un  dfa  particular,  sea  dos? 
^Menor  o  igual  a  dos? 

b.  ^Es  probable  que  x  exceda  de  10?  Explique. 

5.45  IPropenso  a  accidentes  Los  padres 
preocupados  porque  sus  hijos  son  “propensos  a 
accidentes”  pueden  estar  tranquilos,  de  acuerdo  a  un 
estudio  realizado  por  el  Departamento  de  Pediatrfa  de  la 
Universidad  de  California,  San  Francisco.  Los  ninos  que 
se  lesionan  dos  o  mas  veces  tienden  a  sufrir  estas  lesiones 
durante  un  tiempo  relativamente  limitado,  por  lo  general 
un  ano  o  menos.  Si  el  numero  promedio  de  lesiones  por 
ano  para  ninos  en  edad  escolar  es  de  dos,  ^cuales  son  las 
probabilidades  de  estos  eventos? 

a.  Un  nino  sufrira  dos  lesiones  durante  el  ano. 

b.  Un  nino  sufrira  dos  o  mas  lesiones  durante  el  ano. 

c.  Un  nino  sufrira  a  lo  sumo  una  lesion  durante  el  ano. 

5.46  Propenso  a  accidentes,  continua  Consulte 
el  ejercicio  5.45. 

a.  Calcule  la  media  y  desviacion  estandar  para  x,  el 
numero  de  lesiones  por  ano  sufridas  por  un  nino  en 
edad  escolar. 

b.  (iDentro  de  que  limites  esperaria  usted  que  caiga  el 
numero  de  lesiones  por  ano? 

5.47  Bacterias  en  muestras  de  agua  Si  una 

gota  de  agua  se  pone  en  la  platina  y  se  examina  bajo  un 
microscopio,  el  numero  x  de  un  tipo  particular  de  bacteria 
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presente  se  ha  encontrado  que  tiene  una  distribution 
de  probabilidad  de  Poisson.  Suponga  que  la  cantidad 
maxima  permisible  por  especimen  de  agua  para  este 
tipo  de  bacteria  es  cinco.  Si  la  cantidad  media  para  el 
suministro  de  agua  de  usted  es  de  dos  y  usted  prueba 
una  sola  muestra,  /es  probable  que  la  cantidad  exceda  la 
cantidad  maxima  permisible?  Explique. 

5.48  {rote  de  E  soli  Una  mayor  investigation 
y  discusion  se  han  concentrado  sobre  el  numero  de 
enfermedades  que  involucran  al  organismo  Escherichia 
coli  (01257:H7),  que  causa  un  colapso  de  globulos  rojos 
sangumeos  y  hemorragia  intestinal  en  sus  vfctimas.5  De 
acuerdo  con  el  Centro  para  Control  de  Enfermedades, 
un  estimado  de  73  mil  casos  por  infeccion  de  E.  coli 


y  61  fallecimientos  al  ano  ocurren  en  Estados  Unidos. 

Un  brote  en  2006  se  rastreo  hasta  cerdos  salvajes,  que 
dispersaron  la  bacteria  en  un  campo  de  espinacas  en 
California,  enfermo  a  204  personas  en  26  estados  y  1 
en  una  provincia  canadiense.6  Los  brotes  han  ocurrido  a 
un  porcentaje  de  2.5  por  100  mil.  Supongamos  que  este 
porcentaje  no  ha  cambiado. 

a.  (,Cual  es  la  probabilidad  de  que  a  lo  sumo  cinco  casos 
de  E.  coli  por  100  mil  se  informen  en  California  este 
ano? 

b.  /Cual  es  la  probabilidad  de  que  mas  de  cinco  casos  de 
E.  coli  por  100  mil  se  informen  en  California  este  ano? 

c.  Aproximadamente  95%  de  los  sucesos  de  E.  coli 
comprenden  a  lo  sumo  /  cuantos  casos? 


LA  DISTRIBUCION  HIPERGEOMETRICA 
DE  PROBABILIDAD 

Supongamos  que  usted  esta  seleccionando  una  muestra  de  elementos  de  una  poblacion 
y  que  registra  si  cada  elemento  posee  o  no  posee  cierta  caracterfstica.  Usted  esta  regis- 
trando  la  tfpica  information  de  “exito”  o  “fracaso”  que  se  encuentra  en  el  experimento 
binomial.  El  estudio  de  la  muestra  del  ejemplo  5.1,  asf  como  el  muestreo  para  ver  si  hay 
defectos  en  el  ejemplo  5.2.,  son  ilustraciones  de  estas  situaciones  de  muestreo. 

Si  el  numero  de  elementos  de  la  poblacion  es  grande  con  respecto  al  numero  en  la 
muestras  (como  en  el  ejemplo  5.1),  la  probabilidad  de  seleccionar  un  exito  en  un  solo 
intento  es  igual  a  la  proportion  p  de  exitos  en  la  poblacion.  Debido  a  que  la  poblacion 
es  grande  con  respecto  al  tamano  muestral,  esta  probabilidad  permanecera  constante 
(para  todos  los  fines  practicos)  de  un  intento  a  otro  y  el  numero  x  de  exitos  en  la  muestra 
seguira  una  distribucion  binomial  de  probabilidad.  No  obstante,  si  el  numero  de  elemen¬ 
tos  en  la  poblacion  es  pequeno  con  respecto  al  tamano  muestral  (n/N  >  0.5),  la  proba¬ 
bilidad  de  un  exito  para  un  intento  determinado  depende  de  los  resultados  de  intentos 
precedentes.  Entonces  el  numero  x  de  exitos  sigue  lo  que  se  conoce  como  una  distribu¬ 
cion  hipergeometrica  de  probabilidad. 

Es  facil  visualizar  la  variable  hipergeometrica  aleatoria  jc  si  se  considera  un  tazon 
que  contenga  M  esferas  rojas  y  N  —  M  esferas  blancas,  para  un  total  de  N  esferas  en  el 
tazon.  Usted  selecciona  n  esferas  del  tazon  y  registra  x,  el  numero  de  esferas  rojas  que 
vea.  Si  ahora  define  un  “exito”  como  una  esfera  roja,  tendra  un  ejemplo  de  la  variable 
aleatoria  x  hipergeometrica. 

La  formula  para  calcular  la  probabilidad  de  exactamente  k  exitos  en  n  intentos  se  da 
a  continuation. 


LA  DISTRIBUCION  HIPERGEOMETRICA 
DE  PROBABILIDAD 

Una  poblacion  contiene  M  exitos  y  N  —  M  fracasos.  La  probabilidad  de  exactamen¬ 
te  k  exitos  en  una  muestra  aleatoria  de  tamano  n  es 


P(x 


k)  = 


—  ^k  Lr 


CA 
n 
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E  J  E  M  P  L  O 


S  =  V  (vinagre) 

G  =  B  (buen  estado) 


para  valores  de  k  que  dependen  de  N,  M  y  n  con 


s~*N  _ 

B  n 


Ad 


n\(N  —  n)\ 


La  media  y  la  varianza  de  una  variable  aleatoria  hipergeometrica  son  muy  semejan- 
tes  a  las  de  una  variable  aleatoria  binomial  con  una  correction  para  el  tamano  finito 
de  poblacion: 


fju  =  n  I 


2  (m\(N  -  M\(N  -  n 

a~  =  n\  — 

\N 


N 


N-  1 


Un  recipiente  tiene  12  botellas  de  vinos,  3  de  las  cuales  contienen  vino  que  se  ha  echado 
a  perder.  Una  muestra  de  4  botellas  se  selecciona  al  azar  de  entre  la  caja. 

1 .  Encuentre  la  distribution  de  probabilidad  para  x,  el  numero  de  botellas  de  vino 
echado  a  perder  de  la  muestra. 

2.  ^Cuales  son  la  media  y  la  varianza  de  x? 

Para  este  ejemplo,  N  =  12,  n  =  4,  V  =  3  y  (N  —  M)  =  B  =9.  Entonces. 

clcU 


p(x)  = 


s~i\2 

C4 


1.  Los  valores  posibles  para  x  son  0,  1,  2  y  3,  con  probabilidades 


P(  0) 
P(  1) 
P(  2) 
P(  3) 


ClCl  _  1(126)  _ 


495 


Cl  Z 

4 

C]Cl  _  3(84)  _ 


=  .25 


Cl 


del 

cf 


C]c\ 


495 

3(36) 

495 

1(9) 


=  .51 


=  .22 


C\2  495 


=  .02 


2.  La  media  esta  dada  por 


'‘-4«  r1 


y  la  varianza 


a’-Al^U 


12  12 


12-4 

11 


=  .5455 


Un  producto  industrial  particular  se  envia  en  lotes  de  20.  Hacer  pruebas  para  determinar 
si  un  articulo  es  defectuoso  o  costoso;  por  tanto,  el  fabricante  muestrea  la  production 
en  lugar  de  usar  un  plan  de  inspection  del  100%.  Un  plan  de  muestreo  construido  para 
reducir  al  minimo  el  numero  de  piezas  defectuosas,  enviadas  a  los  clientes,  exige  mues- 
trear  cinco  articulos  de  entre  cada  lote  y  rechazar  el  lote  si  se  observa  mas  de  una  pieza 
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defectuosa.  (Si  el  lote  es  rechazado,  cada  artfculo  del  lote  se  prueba  entonces.)  Si  un  lote 
contiene  cuatro  defectuosos,  ^cual  es  la  probabilidad  de  que  sea  aceptado? 

Solut  !  Sea  x  el  numero  de  defectuosos  en  la  muestra.  Entonces  N  =  20,  M  =  4, 
(N  —  M)  =  16  y  =  5.  El  lote  sera  rechazado  si  x  =  2,  3  o  4.  Entonces 

P(aceptar  el  lote)  =  P(x  <  1)  =  p( 0)  +  p(  1)  =  — ^ 

4!  \  /  16!  \  (  4!  \  /  16!  \ 

0!4!  /  \5!  1 1 ! /  \  1  !3 ! /  V 4 !  12 ! / 

-  +  - 

20!  20! 

5 ! 15 !  5 ! 15 ! 


91  455 

- + - =  .2817  +  .4696  =  .7513 

323  969 


© 


EJERCICIOS 


TECNICAS  BASICAS 

5.49  Evalue  estas  probabilidades: 


a. 


c]c] 

c52 


b. 


C\c\ 

Cl 


c. 


b.  ^Cual  es  la  probabilidad  de  que  todos  los  dulces  sean 
rojos? 

c.  <,CuaI  es  la  probabilidad  de  que  todos  los  dulces  sean 
azules? 

APLICACIONES 


5.50  Sea  a  el  numero  de  exitos  observado  en  una 
muestra  de  n  =  5  articulos  seleccionados  de  entre 
N  =  10.  Suponga  que,  de  los  N  =  10  elementos, 

6  eran  considerados  “exitos”. 

a.  Encuentre  la  probabilidad  de  no  observar  exitos. 

b.  Encuentre  la  probabilidad  de  observar  al  menos  dos 
exitos. 

c.  Encuentre  la  probabilidad  de  observar  dos  exitos. 

5.51  Sea  x  una  variable  aleatoria  hipergeometrica  con 
N  =  15,77  =  3yM  =  4. 

a.  Calcule  p{ 0),  p(l),  p( 2)  y  p{ 3). 

b.  Construya  el  histograma  de  probabilidad  para  x. 

c.  Use  las  formulas  dadas  en  la  seccion  5.4  para  calcular 
p,  =  E(x)  y  cr2. 

d.  ^Que  proporcion  de  la  poblacion  de  mediciones  cae 
en  el  intervalo  (p  ±  2cr)?  /,En  el  intervalo  (p  ±  3 cr)? 

Estos  resultados  concuerdan  con  los  dados  por  el 
teorema  de  Chebyshev? 

5.52  Seleccion  de  dulces  Un  plato  de  dulces 
contiene  cinco  dulces  azules  y  tres  rojos.  Un  nino  los 
alcanza  y  selecciona  tres  dulces  sin  verlos. 

a.  /C.ual  es  la  probabilidad  de  que  haya  dos  dulces  azules 
y  uno  rojo  en  la  seleccion? 


5.53  Chips  de  computadora  defectuosos  Una 

pieza  de  equipo  electronico  contiene  seis  chips  de 
computadora,  dos  de  los  cuales  estan  defectuosos.  Tres 
chips  de  computadora  se  seleccionan  para  inspeccionarlos 
y  se  registra  el  numero  de  los  defectuosos.  Encuentre  la 
distribucion  de  probabilidad  para  x,  el  numero  de  chips 
de  computadora  defectuosos.  Compare  sus  resultados  con 
las  respuestas  obtenidas  en  el  ejercicio  4.90. 

5.54  ^Sesgo  en  el  genero?  Una  companfa 
tiene  cinco  solicitantes  para  dos  puestos  de  trabajo: 
dos  mujeres  y  tres  hombres.  Suponga  que  los  cinco 
solicitantes  estan  igualmente  calificados  y  que  no  se 
da  preferencia  para  escoger  genero  alguno.  Sea  x  igual 
al  numero  de  mujeres  escogido  para  ocupar  las  dos 
posiciones. 

a.  Escriba  la  formula  para  p(x),  la  distribucion  de 
probabilidad  de  x. 

b.  ^Cuales  son  la  media  y  la  varianza  de  esta 
distribucion? 

c.  Construya  un  histograma  de  probabilidad  para  x. 

5.55  Credenciales  para  ensehanza  En  el  sur 

de  California,  un  creciente  numero  de  personas  que 
buscan  una  credencial  para  ensenanza  estan  escogiendo 
internados  pagados  en  los  tradicionales  programas 
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estudiantiles  para  ensenanza.  Un  grupo  de  ocho 
candidates  para  tres  posiciones  locales  de  ensenanza 
estaba  formado  por  cinco  candidates,  que  se  habfan 
inscrito  en  internados  pagados  y  tres  candidatos  que  se 
habfan  inscrito  en  programas  tradicionales  estudiantiles 
para  ensenanza.  Supongamos  que  los  ocho  candidatos 
estan  igualmente  calificados  para  las  posiciones. 
Represente  con  x  el  numero  de  candidatos  capacitados 
en  un  internado  que  son  contratados  para  estas  tres 
posiciones. 

a.  L,  La  x  tiene  una  distribucion  binomial  o  una 
distribucion  hipergeometrica?  Apoye  su  respuesta. 

b.  Encuentre  la  probabilidad  de  que  tres  candidatos 
capacitados  en  internado  sean  contratados  para  estas 
posiciones. 

c.  ('Cual  es  la  probabilidad  de  que  ninguno  de  los  tres 
contratados  sea  capacitado  en  internado? 

d.  Encuentre  P(x  si). 


5.56  Tratamiento  a  semillas  Es  frecuente  que  las 
semillas  sean  tratadas  con  un  fungicida  para  protegerlas 
de  ambientes  mal  drenados,  humedos.  En  un  intento  a 
pequena  escala  antes  de  un  experimento  a  gran  escala 
para  determinar  que  dilucion  del  fungicida  aplicar,  cinco 
semillas  tratadas  y  cinco  no  tratadas  se  plantaron  en 
suelo  arcilloso  y  se  registro  el  numero  de  plantas  que 
emergieron  de  las  semillas  tratadas  y  de  las  no  tratadas. 
Suponga  que  la  dilucion  no  fue  eficaz  y  solo  emergieron 
cuatro  plantas.  Represente  con  x  el  numero  de  plantas  que 
emergieron  de  semillas  tratadas. 

a.  Encuentre  la  probabilidad  de  que  x  =  4. 

b.  Encuentre  P( x  s  3). 

c.  Encuentre  P( 2  <  x  <  3). 


REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  La  variable  aleatoria  binomial 

1.  Cinco  caracteristicas:  n  intentos  independientes 
identicos,  cada  uno  resultando  ya  sea  en  exito  (S) 
o  en  fracaso  (F);  la  probabilidad  de  exito  es  p  y  es 
constante  de  un  intento  a  otro;  y  x  es  el  numero  de 
exitos  en  n  intentos. 

2.  Calculo  de  probabilidades  binomiales 

a.  Formula:  P(x  =  k)  =  C\pk  q~k 

b.  Tablas  binomiales  acumulativas 

c.  Probabilidades  individuates  y  acumulativas 
usando  MINITAB 

3.  Media  de  la  variable  aleatoria  binomial:  p  =  np 

4.  Varianza  y  desviacion  estandar:  a2  =  npq  y 
cr  =  \fnpq 

II.  La  variable  aleatoria  de  Poisson 

1 .  El  numero  de  eventos  que  ocurren  en  un  periodo 
o  espacio,  durante  el  cual  se  espera  que  ocurra  un 
promedio  de  p  eventos. 

2.  Calculo  de  probabilidades  de  Poisson 

pke~>i 

a.  Formula:  P(x  =  k)  =  — -r y — 

b.  Tablas  acumulativas  de  Poisson 


c.  Probabilidades  individuates  y  acumulativas 
usando  MINITAB 

3.  Media  de  la  variable  aleatoria  de  Poisson: 

E{x)  =  p 

4.  Varianza  y  desviacion  estandar:  cr2  =  p  y 
cr  =  \fp 

5.  Las  probabilidades  binomiales  se  pueden  apro- 
ximar  con  probabilidades  de  Poisson  cuando 
np  <  7,  usando  p  =  np. 


III.  La  variable  aleatoria  hipergeometrica 

1.  El  numero  de  exitos  en  una  muestra  de  tamano  n 
de  una  poblacion  finita  que  contiene  M  exitos  y 
N  —  M  fracasos. 

2.  Formula  para  la  probabilidad  de  k  exitos  en  n 
intentos: 

WV— M 

P(X  =  k)  = 

3.  Media  de  la  variable  aleatoria  hipergeometrica: 

<M\ 


p  =  n 


N 


4.  Varianza  y  desviacion  estandar: 

(n-  M\(n-  n 


N 


N-  1 


y  cr  =  V  cr 
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Probabilidades  binomiales  y  de  Poisson 


Para  una  variable  aleatoria  que  tiene  una  distribution  de  probabilidad  binomial  o  una 
de  Poisson,  MINITAB  ha  sido  programado  para  calcular  ya  sea  probabilidades  exactas, 
P(x  =  k),  para  un  valor  determinado  de  k  o  las  probabilidades  acumulativas,  P(x  <  k). 
para  un  valor  determinado  de  k.  El  usuario  debe  especificar  cual  distribution  esta  usando 
y  los  parametros  necesarios:  ny  p  para  la  distribution  binomial  y  p  para  la  distribution 
de  Poisson.  Tambien,  tiene  la  option  de  especificar  solo  un  valor  individual  de  k  o  va- 
rios  valores  de  k.  que  deben  guardarse  en  una  columna  (Cl,  por  ejemplo)  de  la  hoja  de 
trabajo  MINITAB. 

Considere  una  distribution  binomial  con  n  =  1 6  y  p  =  .25.  Ni  n  ni  p  aparecen  en  las 
tablas  del  apendice  I.  Como  los  posibles  valores  de  x  para  esta  variable  aleatoria  bino¬ 
mial  varian  de  0  a  16,  podemos  generar  toda  la  distribution  de  probabilidad  asf  como  las 
probabilidades  acumulativas  al  introducir  los  numeros  0  a  16  en  la  columna  Cl. 

Una  forma  de  introducir  rapidamente  un  conjunto  de  enteros  consecutivos  en  una 
columna  es  hacer  lo  siguiente: 


•  Dar  nombre  a  las  columnas  Cl  y  C2  como  “x”  y  “p(x)”,  respectivamente. 


•  Introducir  los  primeros  dos  valores  de  x,  0  y  1 ,  para  crear  un  patron  en  la  colum¬ 
na  Cl. 


•  Usar  el  mouse  para  seleccionar  los  primeros  dos  enteros. 

•  Usar  el  mouse  para  tomar  la  manija  cuadrada  de  la  esquina  inferior  izquierda  del 
area  seleccionada.  Arrastre  la  manija  hacia  abajo  para  continuar  con  el  patron. 


El  usuario  vera  que  aparece  un  entero  en  un  pequeno  cuadro  amarillo.  Suelte  el 


mouse  cuando  tenga  el  numero  deseado  de  enteros,  en  este  caso  16 


Una  vez  introducidos  los  valores  necesarios  de  x,  use  Calc  — »  Probability  Distri¬ 
butions  — »  Binomial  para  generar  el  cuadro  de  dialogo  que  se  muestra  en  la  figura  5.7. 
Teclee  el  numero  de  intentos  y  el  valor  de  p  (Event  probability)  (probabilidad  de  evento) 
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FIGURA  5.8 


FIGURA  5.9 


« 


en  las  cajas  apropiadas,  y  seleccione  “x”  para  la  columna  de  entrada.  (Si  no  teclea  un 
numero  de  columna  para  guardar,  MINITAB  mostrara  los  resultados  en  la  ventana  Ses¬ 
sion.  Si  el  usuario  teclea  C2  o  p(x)  en  la  caja  marcada  “Optional  storage”,  los  resultados 
apareceran  en  la  columna  C2  en  lugar  de  en  la  ventana  Session.)  Verifique  seleccionar  el 
boton  de  radio  marcado  “Probability”.  La  funcion  de  densidad  de  probabilidad  aparece 
en  la  ventana  Session  cuando  de  un  clic  en  OK  (una  parte  se  muestra  en  la  figura  5.8). 
^Cual  es  la  probabilidad  de  que  x  sea  igual  a  4?  ^De  que  sea  3  o  4? 

Para  calcular  probabilidades  acumulativas,  verifique  que  este  seleccionado  el  punto 
marcado  “Cumulative  probability”  y  tec  lee  los  valores  apropiados  de  x  en  Cl.  Si  usted 
tiene  solo  un  valor  de  x,  es  mas  sencillo  seleccionar  la  caja  Input  constant  y  teclear  el 
valor  apropiado.  Por  ejemplo,  para  una  variable  aleatoria  de  Poisson  con  fi  =  5,  use 
Calc  — »  Probability  distributions  — >  Poisson  y  teclee  una  media  de  5.  Introduzca  el 
numero  6  en  la  caja  Input  constant,  de  un  clic  en  OK  y  la  probabilidad  de  que  x  sea  me- 
nor  o  igual  a  6  aparecera  en  la  ventana  Session  (vease  la  figura  5.9). 

(iQue  valor  k  es  tal  que  solo  5%  de  los  valores  de  v  exceden  este  valor  (y  95%  son 
menores  o  iguales  a  k)‘!  Si  usted  teclea  la  probabilidad  .95  en  la  caja  Input  constant,  se¬ 
leccione  la  opcion  marcada  “Inverse  cumulative  probability”  y  de  un  clic  en  OK  (vease 
la  figura  5.10),  entonces  los  valores  de  x  a  cualquier  lado  de  la  “.95  mark”  aparecen 
en  la  ventana  Session  como  en  la  figura  5.11.  Por  tanto,  si  el  usuario  observo  un  valor 
de  x  =  10,  esto  serfa  una  observacion  poco  comun  porque  P(x  >  9)  =  2  —  .968172  = 
.031828. 
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FIGURA  5.10 


FIGURA  5.1  1 


a  S  wit  ion 

q 

Inverse  Cumulative  Distribution  Function 

Poisson  with  neon  •  $ 

x  M  X  <*  x  )  x  P(  X  f  x  ) 
o  o  o.qr.nnj 


< 


EJercicios  suplementarios 

5.57  Haga  una  lista  de  las  cinco  caracterfsticas  del 
experimento  binomial. 

5.58  <Bajo  que  condiciones,  puede  usarse  la  variable 
aleatoria  de  Poisson  para  aproximar  las  probabilidades 
asociadas  con  la  variable  aleatoria  binomial?  ^Que 
aplicaciones  tiene  la  distribucion  de  Poisson  que  no  sea 
estimar  ciertas  probabilidades  binomiales? 

5.59  ^Bajo  que  condiciones,  usarfa  usted  la  distribucion 
hipergeometrica  de  probabilidad  para  evaluar  la 
probabilidad  de  x  exitos  en  n  intentos? 


5.60  Tiro  de  una  moneda  Una  moneda  justa  se 
lanza  al  aire  tres  veces.  Sea  x  igual  al  numero  de  caras 
observado. 

a.  Use  la  formula  para  la  distribucion  binomial  de 
probabilidad  para  calcular  las  probabilidades 
asociadas  con  x  =  0,  1,  2  y  3. 

b.  Construya  la  distribucion  de  probabilidad. 

c.  Encuentre  la  media  y  desviacion  estandar  de  x,  usando 
estas  formulas: 

ix  =  np 
a  =  \Jnpq 
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d.  Usando  la  distribution  de  probabilidad  del  inciso  b), 
encuentre  la  fraction  de  las  mediciones  de  poblacion 
que  esten  a  no  mas  de  una  desviacion  estandar  de 
la  media.  Repita  para  dos  desviaciones  estandar. 
^Como  concuerdan  los  resultados  con  el  teorema  de 
Chebyshev  y  la  Regia  empfrica? 

5.61  Monedas,  continua  Consulte  el  ejercicio  5.60. 
Suponga  que  la  moneda  esta  en  verdad  “cargada” 

y  la  probabilidad  de  que  saiga  una  “cara”  es  igual  a 
p  =  .1.  Siga  las  instrucciones  de  los  incisos  a),  b),  c) 
y  d).  Observe  que  la  distribution  de  probabilidad  pierde 
su  simetrfa  y  se  hace  sesgada  cuando  p  no  es  igual  a  1/2. 

5.62  Porcentajes  para  sobrevivir  al  cancer  El 

porcentaje  de  sobrevivencia  de  10  anos  al  cancer  en  la 
vejiga  es  alrededor  del  50%.  Si  20  personas  que  tienen 
cancer  en  la  vejiga  reciben  tratamiento  adecuado  para  esa 
enfermedad,  <,CLiaI  es  la  probabilidad  de  que 

a.  al  menos  1  sobrevivira  los  10  anos? 

b.  al  menos  10  sobreviviran  los  10  anos? 

c.  al  menos  15  sobreviviran  los  10  anos? 

5.63  Recoleccion  de  basura  El  comisionado  de  un 
municipio  dice  que  80%  de  la  poblacion  de  la  ciudad  esta 
a  favor  de  que  la  recoleccion  de  basura  sea  por  contrato  a 
una  empresa  privada  (en  contraste  a  la  recoleccion  por 
empleados  del  municipio).  Para  verificar  la  teorfa  de  que 
la  proportion  de  personas  en  la  ciudad  a  favor  de  la 
recoleccion  privada  es  .8,  usted  muestrea  al  azar  25 
personas  y  encuentra  que  x,  el  numero  de  personas  que 
apoyan  lo  dicho  por  el  comisionado,  es  22. 

a.  /Cual  es  la  probabilidad  de  observar  al  menos  22  que 
apoyen  lo  dicho  por  el  comisionado  si,  en  efecto, 

p  =  .8? 

b.  ^Cual  es  la  probabilidad  de  que  x  sea  exactamente 
igual  a  22? 

c.  Con  base  en  los  resultados  del  inciso  a),  ^que 
concluirfa  usted  acerca  de  lo  dicho  que  80%  de  todas 
las  personas  de  la  ciudad  esta  a  favor  de  la  recoleccion 
privada?  Explique. 

5.64  inferos  Si  a  una  persona  se  le  da  a  escoger  un 
entero  de  0  a  9,  /es  mas  probable  que  el  o  ella  escoja 
un  entero  cercano  a  la  mitad  de  la  sucesion  que  uno 

de  un  extremo  u  otro? 

a.  Si  es  igualmente  probable  que  los  enteros  sean 
escogidos,  encuentre  la  distribution  de  probabilidad 
para  x,  el  numero  escogido. 

b.  ('Cij  a  I  es  la  probabilidad  de  que  una  persona  escoja  un 
4,  5  o  6? 

c.  /Cual  es  la  probabilidad  de  que  una  persona  no  escoja 
un  4,  5  o  6? 


5.65  Enteros  II  Consulte  el  ejercicio  5.64.  A  20 
personas  se  les  pide  seleccionar  un  numero  de  0  a  9. 

Ocho  de  ellas  escogen  un  4,  5  o  6. 

a.  Si  la  selection  de  cualquier  numero  es  tan  probable 
como  cualquier  otra,  /,cual  es  la  probabilidad  de 
observar  ocho  o  mas  selecciones  de  los  numeros  4, 

5  o  6? 

b.  /,Que  conclusiones  se  sacanan  de  los  resultados  del 
inciso  a)? 

5.66  Seguridad  en  el  trabajo  Un  artfculo  de  USA 
Today  informa  que  entre  personas  de  35  a  65  anos 

de  edad,  casi  dos  terceras  partes  dicen  que  no  estan 
preocupados  por  ser  forzados  a  jubilarse.7  Suponga  que  al 
azar  seleccionamos  n  =  15  personas  que  de  esta  categorfa 
de  edades  y  aproximamos  el  valor  de  p  como  p  =  .7.  Sea 
x  el  numero  que  dicen  que  no  estan  preocupados  por  ser 
forzados  a  jubilarse. 

a.  <',CuaI  es  la  distribution  de  probabilidad  para  xl 

b.  /,Cual  es  P{x  <  8)? 

c.  Encuentre  la  probabilidad  de  que  x  exceda  de  8. 

d.  (,Cual  es  el  valor  maximo  de  c  para  el  cual 
P(x  <  c)  <  .10? 

5.67  Revistas  para  adolescentes  Aun  cuando 
las  revistas  para  adolescentes  Teen  People,  Hachette 
Filipacche  y  File  Girl  dejaron  de  funcionar  en  2006, 

70%  de  las  personas  en  una  encuesta  por  telefono  dijeron 
que  los  adolescentes  todavfa  son  un  mercado  viable 
para  ellas,  pero  no  desean  tftulos  que  les  digan  que  son 
adolescentes.8  Leen  revistas  mas  rehnadas.  Se  selecciona 
una  muestra  al  azar  de  n  =  400. 

a.  (iCual  es  el  numero  promedio  en  la  muestra  que  dijo 
que  los  adolescentes  son  todavfa  un  mercado  viable 
para  las  revistas? 

b.  (iCuaI  es  la  desviacion  estandar  de  este  numero? 

c.  ('.Dentro  de  que  margen  esperarfa  usted  hallar  el 
numero  de  la  muestra  que  dijeron  que  hay  un  mercado 
viable  de  revistas  para  adolescentes? 

d.  Si  solo  225  en  una  muestra  de  400  personas  dijeron 
que  los  adolescentes  aun  son  un  mercado  viable  para 
las  revistas,  /considerana  esto  poco  comun?  Explique. 
(iQue  conclusiones  se  pueden  sacar  de  la  information 
de  esta  muestra? 

5.68  Registrandose  Esperamos  el  momenta 
cuando  lo  dejamos  todo  y  nos  damos  unas  vacaciones. 

No  obstante,  menos  estadounidenses  realmente  ponen 
distancia  al  irse  cuando  estan  de  vacaciones.  Entre 
propietarios  de  pequenos  negocios,  mas  de  la  mitad 
(51%)  dicen  que  se  reportan  a  su  oficina  al  menos 
una  vez  al  dfa  cuando  estan  de  vacaciones;  solo  27% 
dicen  que  cortan  la  comunicacion  por  complete.9  Si  se 
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seleccionan  al  azar  20  propietarios  de  pequenos  negocios 
y  suponemos  que  exactamente  la  mitad  se  reportan  a 
su  oficina  al  menos  una  vez  al  dfa,  entonces  n  =  20  y 
p  =  .5.  Encuentre  las  siguientes  probabilidades. 

a.  Exactamente  16  dicen  que  se  reportan  a  su  oficina  al 
menos  una  vez  al  dfa  cuando  estan  de  vacaciones. 

b.  Entre  15  y  18  (inclusive)  dicen  que  se  reportan  a 
su  oficina  al  menos  una  vez  al  dfa  cuando  estan  de 
vacaciones. 

c.  Cinco  o  menos  dicen  que  se  reportan  a  su  oficina  al 
menos  una  vez  al  dfa  cuando  estan  de  vacaciones. 
(',Serfa  esto  un  acontecimiento  poco  probable? 

5.69  Problemas  psicosomaticos  Una  psiquiatra 
dice  que  80%  de  todas  las  personas  que  van  a  consulta 
tienen  problemas  de  naturaleza  psicosomatica.  Ella 
decide  seleccionar  25  pacientes  al  azar  para  probar  su 
teorfa. 

a.  Suponiendo  que  la  teorfa  de  la  psiquiatra  es  verdadera, 
('  cual  es  el  valor  esperado  de  x,  el  numero  de  los  25 
pacientes  que  tienen  problemas  psicosomaticos? 

b.  ('Cual  es  la  varianza  de  x,  suponiendo  que  la  teorfa  es 
verdadera? 

c.  Encuentre  P(x  <  14).  (Use  tablas  y  suponga  que  la 
teorfa  es  verdadera.) 

d.  Con  base  en  la  probabilidad  del  inciso  c),  si  solo  14  de 
los  25  muestreados  tenfa  problemas  psicosomaticos, 

(',a  que  conclusiones  se  llegarfa  acerca  de  la  teorfa  de 
la  psiquiatra?  Explique. 

5.70  Colegiaturas  de  estudiantes  Una  direccion 
estudiantil  dice  que  80%  de  todos  los  estudiantes  estan 
a  favor  de  un  aumento  en  las  colegiaturas  para  subsidiar 
una  nueva  area  de  recreation.  Una  muestra  aleatoria 

de  n  =  25  estudiantes  produjo  15  a  favor  de  aumentar 
colegiaturas.  ^Cual  es  la  probabilidad  de  que  15  o  menos 
de  la  muestra  esten  a  favor  del  tema  si  la  direccion  esta 
en  lo  correcto?  ^Los  datos  apoyan  la  aseveracion  de  la 
direccion  estudiantil,  o  parece  que  el  porcentaje  que  esta 
a  favor  de  un  aumento  en  colegiaturas  es  menos  del  80%? 

5.71  Canas  en  el  plantel  jLos  planteles 
universitarios  estan  envejeciendo!  De  acuerdo  a  un 
artfculo  reciente,  uno  de  cada  cuatro  estudiantes  tiene 
30  anos  de  edad  o  mas.  Muchos  de  estos  estudiantes 
son  mujeres  que  actualizan  sus  conocimientos  para  el 
trabajo.  Suponga  que  la  cifra  de  25%  es  precisa,  que  su 
universidad  es  representativa  de  universidades  en  general, 
y  que  se  muestran  n  =  200  estudiantes,  registrandose  x, 
el  numero  de  estudiantes  de  30  anos  de  edad  o  mas. 

a.  /Cuales  son  la  media  y  desviacion  estandar  de  x? 

b.  Si  hay  35  estudiantes  en  su  muestra  que  tengan  30 
anos  de  edad  o  mas,  /  estarfa  usted  dispuesto  a  suponer 


que  la  cifra  de  25%  es  representativa  de  su  plantel? 
Explique. 

5.72  Probabilidad  de  lluvia  Casi  todos  los  que 
pronostican  el  clima  se  protegen  muy  bien  cuando 
agregan  probabilidades  a  sus  pronosticos,  diciendo  por 
ejemplo  “La  probabilidad  de  lluvia  para  hoy 

es  40%”.  Entonces,  si  un  pronostico  en  particular  es 
incorrecto,  se  espera  atribuir  el  error  al  comportamiento 
aleatorio  del  clima  mas  que  a  la  imprecision  de  quien 
hace  el  pronostico.  Para  comprobar  la  precision  de  un 
meteorologo  particular,  se  verificaron  registros  solo  para 
aquellos  dfas  cuando  el  meteorologo  predijo  lluvia  “con 
30%  de  probabilidad”.  Una  verification  de  25  de  esos 
dfas  indico  que  llovio  en  10  de  los  25. 

a.  Si  el  meteorologo  es  preciso,  <:,cual  es  el  valor 
apropiado  de  p,  la  probabilidad  de  lluvia  en  uno  de 
los  25  dfas? 

b.  ^Cuales  son  la  media  y  desviacion  estandar  de  x,  el 
numero  de  dfas  en  los  que  llovio,  suponiendo  que 
el  meteorologo  es  preciso? 

c.  Calcule  el  puntaje  z  para  el  valor  observado, 

x  =  10.  [sugerencia:  Recuerde  de  la  section  2.6 
que  el  puntaje  z  es  =  (x  —  /x)/ cr. ] 

d.  (',Estos  datos  estan  en  desacuerdo  con  el  pronostico  de 
un  “30%  de  probabilidad  de  lluvia”?  Explique. 

5.73  iQue  hay  para  desayunar?  Se  lleva  a  cabo  un 
experimento  de  empaque  al  colocar,  uno  junto  a  los  otros, 
dos  disenos  diferentes  de  paquete  para  desayuno  en  un 
estante  de  supermercado.  El  objetivo  del  experimento  es 
ver  si  los  compradores  indican  una  preferencia  por  uno 
de  los  dos  disenos  del  paquete.  En  un  dfa  determinado, 

25  clientes  compraron  un  paquete  del  supermercado. 

Sea  x  igual  al  numero  de  compradores  que  escogieron  el 
segundo  diseno  de  paquete. 

a.  Si  no  hay  preferencia  por  alguno  de  los  dos  disenos, 
(',cual  es  el  valor  de  p,  la  probabilidad  de  que  un 
comprador  escoja  el  segundo  diseno  de  paquete? 

b.  Si  no  hay  preferencia,  use  los  resultados  del  inciso  a) 
para  calcular  la  media  y  desviacion  estandar  de  x. 

c.  Si  5  de  los  25  clientes  escogieron  el  diseno  del 
primer  paquete  y  20  escogieron  el  segundo  diseno, 
^que  concluirfa  usted  acerca  de  la  preferencia  de  los 
compradores  por  el  segundo  diseno  de  paquete? 

5.74  Densidad  de  la  planta  Un  modelo  para 
competencia  de  plantas  supone  que  hay  una  zona 

de  agotamiento  de  recursos  alrededor  de  la  semilla  de 
cada  planta.  Dependiendo  del  tamano  de  las  zonas  y  la 
densidad  de  las  plantas,  las  zonas  de  agotamiento  de 
recursos  pueden  traslaparse  con  las  de  otras  semillas  de  la 
cercanfa.  Cuando  las  semillas  se  dispersan  al  azar  en  una 
superficie  amplia,  el  numero  de  vecinas  que  una  semilla 
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pueda  tener  por  lo  general  sigue  una  distribucion  Poisson 
con  una  media  igual  a  la  densidad  de  semillas  por 
unidad  de  area.  Suponga  que  la  densidad  de  semillas  es 
cuatro  por  metro  cuadrado  (m2). 

a.  /Cual  es  la  probabilidad  de  que  una  semilla 
determinada  no  tenga  vecinos  dentro  de  1  m2? 

b.  ,'Cual  es  la  probabilidad  de  que  una  semilla  tenga  a  lo 
sumo  tres  vecinas  por  m2? 

c.  ,'Cual  es  la  probabilidad  de  que  una  semilla  tenga 
cinco  o  mas  vecinas  por  m2? 

d.  Use  el  hecho  de  que  la  media  y  varianza  de  una 
variable  aleatoria  de  Poisson  son  iguales,  para  hallar 
la  proportion  de  vecinas  que  caerfan  en  el  intervalo 
/jl  =  2a.  Comente  sobre  este  resultado. 

5.75  Genetica  de  plantas  Una  peonia  con  petalos 
rojos  fue  cruzada  con  otra  planta  que  tenia  petalos 
veteados.  La  probabilidad  de  que  un  descendiente  de  esta 
cruza  tenga  flores  rojas  es  .75.  Sea  x  el  numero  de  plantas 
con  petalos  rojos  que  resulte  de  10  semillas  de  esta  cruza 
que  se  recolectaron  y  germinaron. 

a.  (,  La  variable  aleatoria  x  tiene  una  distribucion 
binomial?  Si  no  es  asi,  ^por  que  no?  Si  es  asi, 

/  cuales  son  los  valores  de  n  y  pi 

b.  Encuentre  P(x  >  9). 

c.  Encuentre  P(x  <  1). 

d.  <',Sena  inusual  observar  una  planta  con  petalos  rojos  y 
las  nueve  plantas  restantes  con  petalos  entreverados? 
Si  realmente  se  presentan  estos  resultados,  ^que 
conclusiones  podrian  sacar? 

5.76  Caracterfsticas  dominantes  Los  alelos 
de  color  negro  (B)  y  bianco  (b)  de  plumas  de  polios 
muestran  dominancia  incompleta;  los  individuos  con 
el  par  de  genes  Bb  tienen  plumas  “azules”.  Cuando 
un  individuo  que  es  homocigoto  dominante  (BB)  para 
esta  caracteristica  se  aparea  con  un  individuo  que  es 
homocigoto  recesivo  (bb)  para  esta  caracteristica,  1/4 
de  los  descendientes  llevaran  el  par  BB  de  genes,  1/2 
llevaran  el  par  Bb  de  genes  y  1/4  llevaran  el  par  bb  de 
genes.  Sea  x  el  numero  de  polios  con  plumas  “azules”  en 
una  muestra  de  n  =  20  polios  que  resulta  de  cruzas  que 
involucran  a  polios  homocigotos  dominantes  (BB)  con 
polios  homocigotos  recesivos  (bb). 

a.  (,  La  variable  aleatoria  x  tiene  una  distribucion 
binomial?  Si  no  es  asi,  -.por  que  no?  Si  es  asi, 

/cuales  son  los  valores  de  n  y  pi 

b.  ,'Cual  es  el  numero  medio  de  polios  con  plumas 
“azules”  en  la  muestra? 

c.  ('Cual  es  la  probabilidad  de  observar  menos  de  cinco 
polios  con  plumas  “azules”? 


d.  (■.Ciial  es  la  probabilidad  de  que  el  numero  de  polios 
con  plumas  “azules”  sea  mayor  o  igual  a  10,  pero 
menor  o  igual  a  12? 

5.77  Tiros  al  aire  de  monedas  en  futbol  Durante 
la  temporada  de  futbol  de  1992,  los  Cameras  de  Los 
Angeles  (ahora  Cameras  de  San  Luis)  tenian  una  insolita 
fila  de  perdidas  en  los  tiros  al  aire  de  monedas.  De  hecho, 
perdieron  la  decision  1 1  semanas  en  fila.10 

a.  El  gerente  del  sistema  de  computo  de  los  Carneros 
dijo  que  las  probabilidades  en  contra  de  perder  1 1  tiros 
al  hilo  son  2047  a  1.  ^Esta  bien? 

b.  Despues  que  estos  resultados  se  publicaron,  los 
Carneros  perdieron  la  decision  en  los  siguientes  dos 
juegos,  para  un  total  de  13  perdidas  consecutivas. 
(iCual  es  la  probabilidad  de  que  esto  ocurra  si,  de 
hecho,  la  moneda  era  imparcial? 

5.78  Diabetes  en  ninos  La  diabetes  dependiente 
de  insulina  (IDD)  es  una  enfermedad  cronica  comun  en 
ninos,  que  se  presenta  con  mas  frecuencia  en  personas 
con  ascendencia  del  norte  de  Europa,  pero  la  incidencia 
va  de  1  o  2  casos  en  100000  por  ano  hasta  mas  de  40 
en  100000  en  partes  de  Finlandia.11  Supongamos  que 
una  region  de  Europa  tiene  una  incidencia  de  5  casos  en 
100000  por  ano. 

a.  (',La  distribucion  del  numero  de  casos  de  la  IDD  en 
esta  region  puede  ser  aproximada  por  una  distribucion 
de  Poisson?  Si  es  asi,  /  cual  es  la  media? 

b.  (,Cual  es  la  probabilidad  de  que  el  numero  de  casos 
de  la  IDD  en  esta  region  sea  menor  o  igual  a  3  en 
100000? 

c.  (',Cual  es  la  probabilidad  de  que  el  numero  de  casos  sea 
mayor  o  igual  a  3,  pero  menor  o  igual  a  7  en  100000? 

d.  ^Esperana  usted  observar  10  o  mas  casos  de  la  IDD  en 
100000  en  esta  region  en  un  ano  determinado?  /,Por 
que  si  o  por  que  no? 

5.79  Cintas  de  video  defectuosas  Un  fabricante  de 
cintas  de  video  las  envfa  en  lotes  de  1200  cintas  por  lote. 
Antes  de  un  envfo,  se  seleccionan  al  azar  20  cintas  de 
cada  lote  y  se  prueban.  Si  ninguna  es  defectuosa,  el  lote 
es  enviado.  Si  una  o  mas  son  defectuosas,  todas  las  cintas 
del  lote  se  prueban. 

a.  (',Cual  es  la  distribucion  de  probabilidad  para  x,  el 
numero  de  cintas  defectuosas  en  la  muestra  de  20? 

b.  (iQuc  distribucion  se  puede  usar  para  aproximar 
probabilidades  para  la  variable  aleatoria  x  del 
inciso  a)? 

c.  <',Cual  es  la  probabilidad  de  que  un  lote  sea  enviado 
si  contiene  10  cintas  defectuosas?  ^20  defectuosas? 

^30  defectuosas? 
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5.80  Chocolate  oscuro  A  pesar  de  informes  de  que 
el  chocolate  oscuro  es  benefico  para  el  corazon,  47%  de 
los  adultos  todavra  prefieren  mas  el  chocolate  con  leche 
que  el  oscuro.12  Suponga  que  una  muestra  aleatoria  de 

n  =  5  adultos  se  selecciona  y  se  les  pregunta  si  prefieren 
mas  el  chocolate  con  leche  que  el  oscuro. 

a.  /Cual  es  la  probabilidad  de  que  los  cinco  adultos 
digan  que  prefieren  mas  el  chocolate  con  leche  que  el 
oscuro? 

b.  C u a  1  es  la  probabilidad  de  que  exactamente  tres  de 
los  cinco  adultos  digan  que  prefieren  mas  el  chocolate 
con  leche  que  el  oscuro? 

c.  C u a  1  es  la  probabilidad  de  que  al  menos  un  adulto 
prefiera  mas  el  chocolate  con  leche  que  el  oscuro? 

5.81  Enfermedad  de  Tay-Sachs  La  enfermedad  de 
Tay-Sachs  es  un  mal  genetico  que  por  lo  general  es 
fatal  para  los  ninos.  Si  los  dos  padres  son  portadores 

de  la  enfermedad,  la  probabilidad  de  que  sus  descendientes 
la  desarrollen  es  aproximadamente  .25.  Suponga  que  un 
esposo  y  esposa  son  portadores  de  la  enfermedad  y  que 
la  esposa  ha  estado  embarazada  en  tres  ocasiones.  Si  el 
suceso  de  la  enfermedad  de  Tay-Sachs  en  uno  de  los 
hijos  es  independiente  del  suceso  en  cualquiera  de  los 
otros,  (:,cuales  son  las  probabilidades  de  estos  eventos? 

a.  Los  tres  hijos  desarrollaran  la  enfermedad  de  Tay- 
Sachs. 

b.  Solo  un  hijo  desarrollara  la  enfermedad  de  Tay-Sachs. 

c.  El  tercer  hijo  desarrollara  la  enfermedad  de  Tay- 
Sachs,  dado  que  los  primeros  dos  no  la  tuvieron. 

5.82  Faltar  al  trabajo  Muchos  empleadores  dan  a 
sus  trabajadores  unos  dras  por  enfermedad  asi  como  por 
vacaciones.  Entre  los  trabajadores  que  han  tornado  un  dia 
por  enfermedad  cuando  en  realidad  no  estaban  enfermos, 
49%  dijeron  que  necesitaban  un  descanso.13  Suponga  que 
se  toma  una  muestra  aleatoria  de  n  =  12  trabajadores 
que  tomaron  un  dia  por  enfermedad.  Redondeando 

el  49%  a p  =  .5,  encuentre  las  probabilidades  de  los 
siguientes  eventos. 

a.  /Cual  es  la  probabilidad  de  que  mas  de  seis 
trabajadores  digan  que  tomaron  un  dia  por  enfermedad 
porque  necesitaban  un  descanso? 

b.  ,'Cual  es  la  probabilidad  de  que  menos  de  cinco  de  los 
trabajadores  necesitaban  un  descanso? 

c.  ('  Cual  es  la  probabilidad  de  que  exactamente  10  de  los 
trabajadores  tomaron  un  dia  por  enfermedad  porque 
necesitaban  un  descanso? 

5.83  La  prueba  del  triangulo  Un  procedimiento 
que  se  usa  con  frecuencia  para  controlar  la  calidad  de 
productos  alimenticios  de  marca  utiliza  un  panel  de 
cinco  “probadores”.  Cada  miembro  del  panel  prueba 


tres  muestras,  dos  de  las  cuales  son  de  lotes  del  producto 
que  se  sabe  tiene  el  sabor  deseado  y  la  otra  proviene  del 
ultimo  lote.  Cada  probador  selecciona  la  muestra  que 
es  diferente  de  las  otras  dos.  Suponga  que  el  ultimo  lote 
tiene  el  sabor  deseado  y  que  no  hay  comunicacion  entre 
los  probadores. 

a.  Si  el  ultimo  lote  tiene  el  mismo  sabor  que  los  otros  dos 
lotes,  (Cual  es  la  probabilidad  de  que  el  probador  lo 
escoja  como  el  que  es  diferente? 

b.  (ATial  es  la  probabilidad  de  que  exactamente  uno  de 
los  probadores  escoja  el  ultimo  lote  como  diferente? 

c.  (',Cual  es  la  probabilidad  de  que  al  menos  uno  de  los 
probadores  escoja  el  ultimo  lote  como  el  diferente? 

5.84  ^Devuelve  usted  sus  cuestionarios?  El 

presidente  de  una  companfa,  que  se  especializa  en 
encuestas  de  opinion  ptiblica,  dice  que  alrededor  del  70% 
de  las  personas  a  quienes  la  agencia  envra  cuestionarios 
responde  al  llenar  y  devolver  el  cuestionario.  Se  envfan 
20  de  esos  cuestionarios  y  suponga  que  lo  dicho  por  el 
presidente  es  correcto. 

a.  ^Cual  es  la  probabilidad  de  que  exactamente  10  de  los 
cuestionarios  sean  llenados  y  devueltos? 

b.  ^Cual  es  la  probabilidad  de  que  exactamente  12  de  los 
cuestionarios  sean  llenados  y  devueltos? 

c.  (',Cual  es  la  probabilidad  de  que  a  lo  sumo  10  de  los 
cuestionarios  sean  llenados  y  devueltos? 

5.85  Cuestionarios,  continua  Consulte  el  ejercicio 
5.84.  Si  n  =  20  cuestionarios  se  envfan, 

a.  (',Cual  es  el  numero  promedio  de  cuestionarios  que 
seran  devueltos? 

b.  ^Cual  es  la  desviacion  estandar  del  numero  de 
cuestionarios  que  seran  devueltos? 

c.  Si  x  =  10  de  los  20  cuestionarios  son  devueltos  a 
la  companfa,  ^considerarfa  usted  que  esto  es  una 
respuesta  poco  comun?  Explique. 

5.86  Problemas  en  aves  Una  investigation 
preliminar  informo  que  alrededor  del  30%  de  las 
aves  producidas  en  la  localidad  estaban  infectadas  con 
un  parasito  intestinal  que,  aunque  no  riesgoso  para 
quienes  consumen  las  aves,  disminuye  los  porcentajes 
acostumbrados  de  crecimiento  en  peso  en  las  aves.  Un 
suplemento  en  dieta  que  se  pensaba  era  eficaz  contra  este 
parasito  se  agrego  al  alimento  de  las  aves.  Veinticinco 
aves  se  examinaron  despues  de  tomar  el  suplemento 
durante  al  menos  dos  semanas  y  se  encontro  que  tres  de 
las  aves  estaban  todavra  infectadas  con  el  parasito. 

a.  Si  el  suplemento  de  la  dieta  es  ineficaz,  ^cual  es  la 
probabilidad  de  observar  tres  o  menos  aves  infectadas 
con  el  parasito  intestinal? 
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b.  Si  de  hecho  el  suplemento  alimenticio  era  eficaz 
y  redujo  el  porcentaje  de  infeccion  al  10%,  T.cual 
es  la  probabilidad  de  observar  tres  o  menos  aves 
infectadas? 

5.87  Descomposturas  de  maquinas  En  una  planta 
de  procesamiento  y  empaque  de  alimentos,  en  promedio, 
dos  maquinas  se  descomponen  por  semana.  Suponga  que 
las  descomposturas  semanales  de  maquinas  siguen  una 
distribucion  de  Poisson. 

a.  /Cual  es  la  probabilidad  de  que  no  haya 
descomposturas  de  maquinas  en  una 
semana  determinada? 

b.  Calcule  la  probabilidad  de  que  no  haya  mas  de 
dos  descomposturas  de  maquinas  en  una  semana 
determinada. 

5.88  ^Automovilistas  seguros?  Evidencias 
muestran  que  la  probabilidad  de  que  un  automovilista 
participe  en  un  grave  accidente  de  automovil  durante 
un  ano  determinado  es  .01.  Una  companfa  en  particular 
emplea  100  representantes  de  ventas  viajeros  a 
tiempo  completo.  Con  base  en  esta  evidencia,  use  la 
aproximacion  Poisson  a  la  distribucion  binomial  para 
hallar  la  probabilidad  de  que  exactamente  dos  de  los 
representantes  de  ventas  participen  en  un  grave  accidente 
automovilfstico  durante  el  ano  venidero. 

5.89  listresado  A  un  individuo  se  le  ensena  a 
hacer  un  trabajo  en  dos  modos.  Estudios  realizados  han 
demostrado  que  cuando  es  sometido  a  esfuerzo  mental 

y  se  le  pide  efectuar  el  trabajo,  el  individuo  casi  siempre 
revierte  el  metodo  que  aprendio  primero,  sin  considerar 
si  era  mas  facil  o  mas  diffcil.  Si  la  probabilidad  de  que 
un  sujeto  regrese  al  primer  metodo  aprendido  es  .8  y  seis 
sujetos  son  probados,  /cual  es  la  probabilidad  de  que  al 
menos  cinco  de  los  individuos  reviertan  al  primer  metodo 
aprendido  cuando  se  les  pida  efectuen  su  trabajo  bajo 
estres? 

5.90  Inscribirse  en  la  universidad  Una  universidad 
de  la  costa  oeste  ha  encontrado  que  alrededor  del  90%  de 
sus  solicitantes,  aceptados  para  inscripcion  en  el  grupo 
de  primer  ano,  en  realidad  se  inscriben.  En  2007,  1360 
solicitantes  fueron  aceptados  a  la  universidad.  ^Dentro  de 
que  lfmites  esperarfa  usted  hallar  el  tamano  del  grupo 

de  primer  ano  en  esta  universidad  en  el  verano  de  2007? 

5.91  Terremotos  Suponga  que  uno  de  entre 
10  propietarios  de  casa  en  el  estado  de  California 
ha  invertido  en  un  seguro  contra  terremotos.  Si  15 
propietarios  se  seleccionan  al  azar  para  ser  entrevistados. 


a.  /,Cual  es  la  probabilidad  de  que  al  menos  uno  tenia 
seguro  contra  terremotos? 

b.  /Cual  es  la  probabilidad  de  que  cuatro  o  mas  tengan 
seguro  contra  terremotos? 

c.  /.Dentro  de  que  llmites  esperarfa  usted  que  baje  el 
numero  de  propietarios  asegurados  contra  terremotos? 

5.92  Vial  alambrado  Los  paneles  de  control 
alambrados  incorrectamente  se  instalaron  por  error  en 
dos  de  cada  ocho  maquinas-herramientas  automaticas 
grandes.  No  es  seguro  saber  cual  de  las  maquinas- 
herramientas  tienen  los  paneles  defectuosos  y  se 
selecciona  al  azar  una  muestra  de  cuatro  herramientas 
para  inspeccionarlas.  /.Cual  es  la  probabilidad  de  que  la 
muestra  no  incluya  paneles  defectuosos?  /A  mhos  paneles 
defectuosos? 

5.93  Comer  a  la  carrera  /,C6mo  sobrevive  usted 
cuando  no  hay  tiempo  para  comer,  ya  sea  un  bocado 
rapido,  nada  de  alimento  o  una  barra  de  protefna,  o 
dulce?  Un  artfculo  de  USA  Today  indica  que  36%  de 
mujeres  entre  25  y  55  anos  de  edad  dijeron  que,  cuando 
estan  demasiado  ocupadas  para  comer,  adquieren  una 
comida  rapida  en  un  restaurante  con  entrada  para  autos.14 
Se  selecciona  una  muestra  al  azar  de  100  mujeres  de 
entre  25  y  55  anos  de  edad. 


Como  comen  mujeres  a  la  carrera 


40%  - 


En  auto  Saltarse  Barra  de  Dulce/ 
una  comida  protemas  o  bocadillo 
licuado 


a.  /,Cual  es  el  numero  promedio  de  mujeres  que  dicen 
que  toman  comida  rapida  cuando  estan  demasiado 
ocupadas  para  comer? 

b.  ('  Cual  es  la  desviacion  estandar  para  el  numero  de 
mujeres  que  dicen  que  toman  comida  rapida  cuando 
estan  demasiado  ocupadas  para  comer? 

c.  Si  49  de  las  mujeres  de  la  muestra  dijeron  que  toman 
comida  rapida  cuando  estan  demasiado  ocupadas 
para  comer,  /,esto  serfa  un  suceso  poco  comun? 
Explique. 
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m  APPLET 

Use  el  applet  Calculating  Binomial  Probabilities 
(Calculando  probabilidades  binomiales)  para  el 
siguiente  conjunto  de  ejercicios. 

5.94  Consulte  los  ejercicios  5.8  y  5.9. 

a.  Use  el  applet  para  construir  el  histograma  de 
probabilidad  para  una  variable  aleatoria  binomial  x 
con  n  =  6  y  p  =  .2. 

b.  Use  el  applet  para  construir  el  histograma  de 
probabilidad  para  una  variable  aleatoria  binomial 
x  con  n  =  6  y  p  =  .8.  /Como  describirfa  usted  las 
formas  de  las  distribuciones  de  los  incisos  a)  y  b)? 

c.  Use  el  applet  para  construir  el  histograma  de 
probabilidad  para  una  variable  aleatoria  binomial  x 
con  n  =  6  y  p  =  .5.  /Como  describirfa  usted  la  forma 
de  esta  distribucion? 

5.95  Use  el  applet  para  hallar  lo  siguiente: 

a.  P(x  <  6)  para  n  =  22,  p  =  .65 

b.  P(x  =  8)  para  n  =  12 ,p=  .4 

c.  P( x  >  14)  para  n  =  20,  p  =  .5 

d.  P( 2  <  x  <  6)  para  n  =  15,  p  =  .3 

e.  P(x  >  6)  para  n  =  50,  p  =  .7 

5.96  Cirugias  exitosas  Se  dice  que  un  nuevo 
procedimiento  quirurgico  es  exitoso  en  80%  de  las  veces. 
Suponga  que  la  operacion  se  efectua  cinco  veces 

y  se  supone  que  los  resultados  son  independientes  entre 
sf.  /Cuales  son  las  probabilidades  de  estos  eventos? 

a.  Las  cinco  operaciones  son  exitosas. 

b.  Exactamente  cuatro  son  exitosas. 

c.  Menos  de  dos  son  exitosas. 

5.97  Cirugia,  continua  Consulte  el  ejercicio  5.96.  Si 
menos  de  dos  operaciones  fueron  exitosas,  /que  pensarfa 
usted  del  trabajo  del  equipo  de  cirujanos? 

5.98  Falla  en  un  motor  Suponga  que  los  cuatro 
motores  de  un  avion  comercial  estan  arreglados  para 


operar  de  manera  independiente  y  que  la  probabilidad 
de  falla  en  vuelo  de  un  solo  motor  es  .01.  /Cual  es  la 
probabilidad  de  los  siguientes  eventos  en  un  vuelo 
determinado? 

a.  No  se  observan  fallas. 

b.  No  se  observa  mas  de  una  falla. 

5.99  ^McDonald's  o  Burger  King?  Suponga 
que  50%  de  todos  los jovenes  adultos  prefieren  mas 
a  McDonald’s  que  a  Burger  King  cuando  se  les  pide 
indicar  una  preferencia.  Un  grupo  de  100  jovenes  adultos 
se  seleccionaron  al  azar  y  se  registraron  sus  preferencias. 

a.  /Cual  es  la  probabilidad  de  que  mas  de  60  prefirieron 
McDonald’s? 

b.  /Cual  es  la  probabilidad  de  que  entre 

40  y  60  (inclusive)  prefirieron  McDonald’s? 

c.  /Cual  es  la  probabilidad  de  que  entre 

40  y  60  (inclusive)  prefirieron  Burger  King? 

5.100  Destinos  para  vacaciones  Los  altos  precios 
en  combustibles  pueden  hacer  que  algunos  vacacionistas 
estadounidenses  se  queden  cerca  de  casa.  No  obstante, 
cuando  se  les  da  una  opcion  de  lugares  para  vacacionar, 
66%  de  viajeros  de  placer  de  Estados  Unidos  indicaron 
que  les  gustarfa  visitar  parques  nacionales.15  Se 
selecciono  una  muestra  aleatoria  de  n  =  100  viajeros 

de  placer. 

a.  /Cual  es  el  promedio  de  x,  el  numero  de  viajeros  de 
la  muestra  que  indican  que  les  gustarfa  visitar  parques 
nacionales?  /Cual  es  la  desviacion  estandar  de  xl 

b.  /Sena  poco  probable  hallar  solo  50  o  menos  de  los 
muestreados  que  indiquen  que  les  gustarfa  visitar 
parques  nacionales?  Use  el  applet  para  hallar  la 
probabilidad  de  este  evento. 

c.  /Cuantas  desviaciones  estandar  a  partir  de  la  media 
es  el  valor  x  =  50?  /Esto  confirma  su  respuesta  al 
inciso  b)? 
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CASO 

prActico 


6Que  tan  seguro  es  vivir  cerca  de  un  reactor  nuclear?  Hombres  que  vivfan  en  una  franja 
costera  que  se  extiende  20  millas  al  norte  de  un  reactor  nuclear  en  Plymouth,  Massa¬ 
chusetts,  desarrollaron  algunas  formas  de  cancer  a  un  ritmo  50%  mayor  que  el  de  todo 
el  estado,  de  acuerdo  con  un  estudio  apoyado  por  el  Departamento  de  Salud  Publica  de 
Massachusetts  y  publicado  el  21  de  mayo  de  1987  en  la  edition  del  New  York  Times.16 

La  causa  de  los  canceres  es  un  misterio,  pero  se  ha  sugerido  que  el  cancer  estaba 
vinculado  al  reactor  Pilgrim  I,  que  habfa  sido  cerrado  durante  13  meses  debido  a  pro- 
blemas  de  administration.  Boston  Edison,  propietaria  del  reactor,  reconocio  escapes 
de  radiation  a  mediados  del  decenio  de  1970  que  estuvieron  un  poco  arriba  de  nive- 
les  permisibles.  Si  el  reactor  era  en  efecto  responsable  por  el  excesivo  porcentaje 
de  cancer,  entonces  el  nivel  de  radiation  reconocido  actualmente  requerido  para  cau- 
sar  cancer  tendrfa  que  cambiar.  No  obstante,  el  misterio  mas  desconcertante  fue  el 
hecho  de  que  las  mujeres  en  esa  misma  zona  aparentemente  no  fueron  afectadas. 

En  su  informe,  el  Dr.  Sidney  Cobb,  epidemiologo,  observo  el  enlace  entre  los 
escapes  de  radiation  en  el  reactor  Pilgrim  I  y  52  casos  de  cancer  hemapoyetico.  El 
informe  indicaba  que  este  numero  inesperadamente  grande  podrfa  ser  atribuible  a 
escapes  radiactivos  en  el  aire  salido  del  Pilgrim  I,  concentrado  a  lo  largo  de  la  costa 
por  los  patrones  de  viento  y  no  disipados,  como  supusieron  inspectores  de  reglamen- 
tos  del  gobierno.  ^Que  tan  poco  comiin  fue  este  numero  de  casos  de  cancer?  Esto  es, 
estadisticamente  hablando,  £el  52  es  un  numero  altamente  improbable  de  casos?  Si  la 
respuesta  es  afirmativa,  entonces  algun  factor  externo  (posiblemente  radiation)  causo 
este  numero  anormalmente  grande,  o  bien,  hemos  observado  un  evento  muy  raro. 

La  distribution  de  probabilidad  de  Poisson  da  una  buena  aproximacion  a  las  distri- 
buciones  de  variables  por  ejemplo  el  numero  de  fallecimientos  en  una  region  debido  a 
una  rara  enfermedad,  el  numero  de  accidentes  en  una  planta  manufacturera  por  mes, 
o  el  numero  de  choques  de  lineas  aereas  por  mes.  Por  tanto,  es  razonable  suponer  que 
la  distribution  de  Poisson  da  un  modelo  apropiado  para  el  numero  de  casos  de  cancer 
en  este  ejemplo. 


1 .  Si  los  52  casos  publicados  representaban  un  porcentaje  50%  mas  alto  que  el  porcentaje 
a  nivel  del  estado,  ^cual  es  una  estimation  razonable  de  /x,  el  numero  promedio  de 
esos  casos  de  cancer  a  nivel  de  todo  el  estado? 

2.  Con  base  en  la  estimation  de  usted  respecto  a  /x,  -cual  es  la  desviacion  estandar  esti- 
mada  del  numero  de  casos  de  cancer  al  nivel  de  todo  el  estado? 

3.  ^Cual  es  el  puntaje  z  para  los  x  =  52  casos  observados  de  cancer?  ^Como  inter- 
preta  usted  este  puntaje  z  en  vista  de  la  preocupacion  por  el  elevado  porcentaje  de 
cancer  hemapoyetico  en  esta  zona? 
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OBJETIVOS  GENERALES 

En  los  capitulos  4  y  5,  usted  aprendio  acerca  de  variables 
aleatorias  discretas  y  sus  distribuciones  de  probabilidad. 
En  este  caprtulo  veremos  variables  aleatorias  continuas  y 
sus  distribuciones  de  probabilidad,  asf  como  una  variable 
aleatoria  continua  muy  importante,  la  normal.  Usted 
vera  como  calcular  probabilidades  normales  y,  bajo  ciertas 
condiciones,  como  usar  la  distribucion  normal  de 
probabilidad  para  aproximar  la  distribucion  binomial 
de  probabilidad.  Entonces,  en  el  caprtulo  7  y  en  los 
capitulos  que  siguen,  veremos  la  forma  en  que  la  distribu¬ 
cion  normal  de  probabilidad  desempena  un  papel  central 
en  inferencia  estadistica. 


INDICE  DELCAPITULO 

Calculo  de  areas  asociadas  con  la  distribucion  normal 
de  probabilidad  (6.3) 

La  aproximacion  normal  a  la  distribucion  binomial  de 
probabilidad  (6.4) 

La  distribucion  normal  de  probabilidad  (6.2) 
Distribuciones  de  probabilidad  para  variables  aleatorias 
continuas  (6.1) 


ENTRENADOR  PERSONAL 


£Como  utilizo  la  tabla  3  para  calcular  probabilidades 
bajo  la  curva  normal  estandar? 

£Como  calculo  probabilidades  binomiales  usando 
la  aproximacion  normal? 


W  La  larga  y  la  corta 

Si  usted  fuera  el  jefe,  <\la  estatura  desempenana 
un  papel  en  la  seleccion  de  un  sucesor  para  el  tra- 
bajo  de  usted? A  proposito  escogerfa  un  sucesor 
que  fuera  de  menor  estatura  que  usted?  El  estudio 
practico  que  esta  al  final  de  este  capitulo  examina 
como  se  puede  usar  la  curva  normal  para  inves- 
tigar  la  distribucion  de  estaturas  de  chinos  elegi- 
bles  para  un  trabajo  muy  prestigioso. 
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DISTRIBUCIONES  DE  PROBABILIDAD 
PARA  VARIABLES  ALEATORIAS 
CONTINUAS 

Cuando  una  variable  aleatoria  x  es  discreta,  se  puede  asignar  una  probabilidad  positiva 
a  cada  uno  de  los  valores  que  x  pueda  tomar  y  obtener  la  distribucion  de  probabilidad 
para  x.  La  suma  de  todas  las  probabilidades  asociada  con  los  diferentes  valores  de  x  es 
1,  pero  no  todos  los  experimentos  resultan  en  variables  aleatorias  que  sean  discretas. 
Las  variables  aleatorias  continuas,  por  ejemplo  estaturas  y  pesos,  lapso  de  vida  util 
de  un  producto  en  particular  o  un  error  experimental  de  laboratorio,  pueden  tomar  los 
infinitamente  numerosos  valores  correspondientes  a  puntos  en  un  intervalo  de  una  recta. 
Si  se  trata  de  asignar  una  probabilidad  positiva  a  cada  uno  de  estos  numerosos  valores, 
las  probabilidades  ya  no  sumaran  1,  como  es  el  caso  con  variables  aleatorias  discretas. 
Por  tanto,  se  debe  usar  un  metodo  diferente  para  general-  la  distribucion  de  probabilidad 
para  una  variable  aleatoria  continua. 

Supongamos  que  usted  tiene  un  conjunto  de  mediciones  en  una  variable  aleatoria 
continua  y  que  crea  un  histograma  de  frecuencia  relativa  para  describir  la  distribucion  de 
las  mismas.  Para  un  pequeno  rui mem  de  mediciones,  se  puede  usar  un  pequeno  niimero 
de  clases;  entonces,  a  medida  que  se  recolecten  mas  y  mas  mediciones,  se  pueden  usar 
mas  clases  y  reducir  el  ancho  de  clase.  El  perfil  del  histograma  cambiara  ligeramente, 
casi  todo  el  tiempo  haciendose  cada  vez  mas  irregular,  como  se  muestra  en  la  figura  6. 1 . 
Cuando  el  numero  de  mediciones  se  hace  muy  grande  y  los  anchos  de  clase  se  hacen 
muy  angostos,  el  histograma  de  frecuencia  relativa  aparece  cada  vez  mas  como  la  curva 
suave  que  aparece  en  la  figura  6. Id).  Esta  curva  suave  describe  la  distribucion  de  pro¬ 
babilidad  de  la  variable  aleatoria  continua. 


FIGURA  6.1 

Histogramas  de  frecuencia 
relativa  para  tamanos 
muestrales  cada  vez  mas 
crecientes 
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^Como  se  puede  crear  un  modelo  para  esta  distribution  de  probabilidad?  Una  va¬ 
riable  aleatoria  continua  puede  tomar  cualquiera  de  un  numero  infinito  de  valores  de  la 
recta  real,  en  forma  semejante  al  numero  infinito  de  granos  de  arena  en  una  playa.  La 
distribution  de  probabilidad  es  creada  al  distribuir  una  unidad  de  probabilidad  a  lo  largo 
de  la  recta,  igual  que  como  se  puede  distribuir  un  punado  de  arena.  La  probabilidad, 
es  decir  granos  de  arena  o  de  mediciones,  se  apilaran  en  ciertos  lugares  y  el  resultado  es 
la  distribution  de  probabilidad  mostrado  en  la  figura  6.2.  La  profundidad  o  densidad 
de  la  probabilidad,  que  varfa  con  x,  puede  ser  descrita  por  una  formula  matematica  /Dc), 
llamada  distribution  de  probabilidad  o  funcion  de  densidad  de  probabilidad  para  la 
variable  aleatoria  x. 


FIGURA  6.2 

La  distribucion  de 
probabilidad  f(xj; 

P(a  <  x  <  b )  es  igual 
al  area  sombreada  bajo 
la  curva 


M 


P(a  <x<b) 


a  b 


x 


Para  variables 
aleatorias  continuas, 

area  =  probabilidad. 


CONSEJO 


El  area  bajo  la  curva 
es  igual  a  1. 


Varias  propiedades  importantes  de  distribuciones  continuas  de  probabilidad  son  com¬ 
parables  a  sus  similares  discretas.  Asf  como  la  suma  de  probabilidades  discretas  (o  la 
suma  de  las  frecuencias  relativas)  es  igual  a  1  y  la  probabilidad  de  que  x  caiga  en  cierto 
intervalo  puede  hallarse  al  sumar  las  probabilidades  en  ese  intervalo,  las  distribuciones 
de  probabilidad  tienen  las  caracterfsticas  que  se  detallan  a  continuation. 

•  El  area  bajo  una  distribucion  continua  de  probabilidad  es  igual  a  1. 

•  La  probabilidad  de  que  x  caiga  en  un  intervalo  particular,  por  ejemplo  de  a  a  h, 
es  igual  al  area  bajo  la  curva  entre  los  dos  puntos  ay  b.  Esta  es  el  area  sombreada 
de  la  figura  6.2. 

Tambien  hay  una  diferencia  importante  entre  variables  aleatorias  discretas  y  conti¬ 
nuas.  Considere  la  probabilidad  de  que  x  sea  igual  a  algtin  valor  en  particular,  por  ejem¬ 
plo  a.  Como  no  hay  area  arriba  de  un  solo  punto,  por  ejemplo  x  =  a,  e n  la  distribucion 
de  probabilidad  para  una  variable  aleatoria  continua,  nuestra  definition  implica  que  la 
probabilidad  es  0. 

•  P(x  =  a)  =  0  para  variables  aleatorias  continuas. 

•  Esto  implica  que  P(x  >  a)  =  P(x  >  a)  y  P(x  <  a)  =  P(x  <  a). 

•  Esto  no  es  cierto  en  general  para  variables  aleatorias  discretas. 

^Como  se  escoge  el  modelo,  es  decir,  la  distribucion  de  probabilidad  fix)  apropiada 
para  un  experimento  dado?  Existen  muchos  tipos  de  curvas  continuas  para  modelar. 
Algunas  son  de  forma  de  monticulo,  como  la  de  la  figura  6. Id),  pero  otras  no  lo  son.  En 
general,  trate  de  escoger  un  modelo  que  satisfaga  estos  criterios: 

•  Se  ajusta  al  cuerpo  de  datos  acumulado. 

•  Permite  hacer  las  mejores  inferencias  posibles  usando  los  datos. 
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FIGURA  6.3 

Una  distribucion  uniforme 
de  probabilidad 


La  variable  aleatoria  uniforme  se  emplea  para  modelar  el  comportamiento  de  una  varia¬ 
ble  aleatoria  continua  cuyos  valores  esten  uniforme  o  exactamente  distribuidos  en  un 
intervalo  dado.  Por  ejemplo,  es  probable  que  el  error  x  introducido  al  redondear  una 
observation  a  la  pulgada  mas  cercana  tenga  una  distribution  uniforme  en  el  intervalo 
de  —.5  a  .5.  La  funcion  de  densidad  de  probabilidad  f(x)  serfa  “plana”  como  se  muestra 
en  la  figura  6.3.  La  altura  del  rectangulo  esta  fija  en  1,  de  modo  que  el  area  total  bajo  la 
distribution  de  probabilidad  es  1 . 


('  Cual  es  la  probabilidad  de  que  el  error  de  redondeo  sea  menor  a  .2  en  magnitud? 

Solution  Esta  probabilidad  corresponde  al  area  bajo  la  distribution  entre  x  =  —  .2  y 
x  =  .2.  Como  la  altura  del  rectangulo  es  1, 

P{  — .2  <  x  <  .2)  =  [.2  -  (-.2)]  X  1  =  .4 


La  variable  aleatoria  exponencial  se  utiliza  para  modelar  variables  aleatorias  continuas 
tales  como  tiempos  de  espera  o  vidas  utiles  asociadas  con  componentes  electronicos. 
Por  ejemplo,  el  tiempo  de  espera  en  una  caja  de  pago  de  un  supermercado  tiene  una 
distribucion  exponencial  con  un  tiempo  de  espera  promedio  de  5  minutos.  La  funcion 
de  densidad  de  probabilidad  f(x)  =  ,2e  2l  se  ilustra  en  la  figura  6.4.  Para  hallar  areas 
bajo  esta  curva,  se  puede  usar  el  hecho  de  que  P(x  >  a)  =  e~2“  para  a  >  0.  ^Cual  es  la 
probabilidad  de  que  usted  tenga  que  esperar  10  minutos  o  mas  en  la  caja  de  pago  del 
supermercado? 


FIGURA  6.4 

Una  distribucion  de 
probabilidad  exponencial 


Solucion  La  probabilidad  a  calcular  es  el  area  sombreada  en  la  figura  6.4.  Use  la 
formula  general  para  P(x  >  a)  para  hallar 

P(x>  10)  =  e~'2(10)  =  .135 
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Su  modelo  puede  no  siempre  ajustar  perfectamente  la  situacion  experimental,  pero  debe 
tratar  de  escoger  un  modelo  que  mejor  se  ajuste  al  histograma  de  frecuencia  relativa 
poblacional.  Cuanto  mejor  se  aproxime  el  modelo  a  la  realidad,  mejores  seran  las  inferen- 
cias.  Por  fortuna,  muchas  variables  aleatorias  continuas  tienen  distribuciones  de  fre¬ 
cuencia  de  forma  de  monticulo,  por  ejemplo  los  datos  de  la  figura  6.  Id).  La  distribucion 
normal  de  probabilidad  da  un  buen  modelo  para  describir  este  tipo  de  datos. 


LA  DISTRIBUCION  NORMAL 
DE  PROBABILIDAD 

Las  distribuciones  de  probabilidad  continua  pueden  tomar  varias  formas,  pero  un  gran 
niimero  de  variables  aleatorias  observadas  en  la  naturaleza  poseen  una  distribucion  de 
frecuencia  que  tiene  mas  o  menos  la  forma  de  monticulo,  o  bien,  como  dirfa  un  esta- 
distico,  es  aproximadamente  una  distribucion  normal  de  probabilidad.  La  formula  que 
genera  esta  distribucion  se  muestra  a  continuation. 


DISTRIBUCION  NORMAL  DE  PROBABILIDAD 

fix)  =  — ~=  e-(*_'i)2/(2o'2)  -oo  <  x  <  oo 

(A/Itt 

Los  simbolos  ey  v  son  constantes  matematicas  dadas  en  forma  aproximada  por 
2.7183  y  3.1416,  respectivamente;  \x  y  a  (a  >  0)  son  parameters  que  representan  la 
media  poblacional  y  desviacion  estandar,  respectivamente. 


La  grafica  de  una  distribucion  normal  de  probabilidad  con  media  fx  y  desviacion 
estandar  crse  muestran  en  la  figura  6.5.  La  media  fx  localiza  el  centro  de  la  distribucion, 
y  la  distribucion  es  simetrica  alrededor  de  su  media  /x.  Como  el  area  total  bajo  la  distri¬ 
bucion  normal  de  probabilidad  es  igual  a  1,  la  simetrfa  implica  que  el  area  a  la  derecha 
de  /X  es  .5  y  el  area  a  la  izquierda  de  fx  es  tambien  .5.  La  forma  de  la  distribucion  esta  de- 
terminada  por  cr,  la  desviacion  estandar  de  la  poblacion.  Como  se  puede  ver  en  la  figura 
6.6,  valores  grandes  de  a  reducen  la  altura  de  la  curva  y  aumentan  la  dispersion;  valo- 
res  pequenos  de  a  aumentan  la  altura  de  la  curva  y  reducen  la  dispersion.  La  figura  6.6 
muestra  tres  distribuciones  normales  de  probabilidad  con  diferentes  medias  y  desviacio- 
nes  estandar.  Notense  las  diferencias  en  forma  y  ubicacion. 


FIGURA  6.5 

Distribucion  normal 
de  probabilidad 


m 


El  area  a  la  izquierda  de 
la  media  es  igual  a  .5 


El  area  a  la  derecha  de 
la  media  es  igual  a  .5 


|i-  (7  |i  |X  +  <T 
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FIGURA  6.6 

Distribuciones  normales  de 
probabilidad  con  valores 
de  /xy  o-que  difieren 


X 


El  applet  Java  llamada  Visualizing  Normal  Curves  (Visualizar  Curvas  Normales) 
da  una  imagen  visual  de  la  distribucion  normal  para  valores  de  /a  entre  — 10  y  +8 
y  para  valores  de  cr  entre  .5  y  1.8.  La  curva  azul  oscuro  es  la  normal  estandar  z  con 
media  0  y  desviacion  estandar  1.  Se  puede  usar  este  applet  para  comparar  su  forma 
con  la  forma  de  otras  curvas  normales  (la  curva  roja  en  su  monitor,  azul  claro  en  la 
figura  6.7)  al  mover  los  cursores  para  cambiar  la  media  y  desviacion  estandar.  (;  Que 
ocurre  cuando  se  cambia  la  media?  Y  cuando  se  cambia  la  desviacion  estandar? 


FIGURA  6.7 

Applet  Visualizing 
Normal  Curves 
(Visualizar  Curvas 
Normales) 


Raras  veces  se  encuentra  una  variable  con  valores  que  sean  infinitamente  pequenos 
(— oo)  o  infinitamente  grandes  (+00).  Aun  asf,  muchas  variables  aleatorias  positivas  (por 
ejemplo  estaturas,  pesos  y  tiempos)  tienen  distribuciones  que  son  bien  aproximadas 
por  una  distribucion  normal.  De  acuerdo  con  la  Regia  empirica,  casi  todos  los  valores  de 
una  variable  aleatoria  normal  se  encuentran  en  el  intervalo  p  ±  3cr.  Mientras  los  valores 
dentro  de  tres  desviaciones  estandar  de  la  media  sean  positivos,  la  distribucion  normal 
da  un  buen  modelo  para  describir  los  datos. 
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Areas  tabuladas  de  la  distribucion 

NORMAL  DE  PROBABILIDAD 

Para  hallar  la  probabilidad  de  que  una  variable  aleatoria  normal  x  se  encuentre  en  el 
intervalo  de  a  a  b,  necesitamos  hallar  el  area  bajo  la  curva  normal  entre  los  puntos 
ay  b  (vease  la  figura  6.2).  No  obstante  (vease  la  figura  6.6),  hay  un  numero  infinita- 
mente  grande  de  distribuciones  normales,  uno  para  cada  media  y  desviacion  estandar 
diferentes.  Una  tabla  separada  de  areas  para  cada  una  de  estas  curvas  es  obviamen- 
te  impractica;  en  cambio,  usamos  un  procedimiento  de  estandarizacion  que  nos  permite 
usar  la  misma  tabla  para  todas  las  distribuciones  normales. 


CONSEJO 


El  area  bajo  la  curva  zes 
igual  a  1. 


La  variable  aleatoria  normal  estandar 

Una  variable  aleatoria  normal  x  esta  estandarizada  al  expresar  su  valor  como  el  numero 
de  desviaciones  estandar  (cr)  que  se  encuentran  a  la  izquierda  o  derecha  de  su  media 
[a.  Este  es  realmente  solo  un  cambio  en  las  unidades  de  medida  que  usamos,  como  si 
estuvieramos  midiendo  en  pulgadas  en  lugar  de  pies.  La  variable  aleatoria  normal  estan¬ 
darizada,  z,  se  define  como 

X  ~  yU- 
2  ~  cr 

o  bien,  lo  que  es  equivalente, 

X  =  yU,  +  Z<y 

De  la  formula  para  z,  podemos  sacar  estas  conclusiones: 

•  Cuando  x  es  menor  que  la  media  /jl.  el  valor  de  z  es  negativo. 

•  Cuando  x  es  mayor  que  la  media  /jl,  el  valor  de  z  es  positivo. 

•  Cuando  x  =  /jl,  el  valor  de  z  =  0. 

La  distribucion  de  probabilidad  para  z,  ilustrada  en  la  figura  6.8,  se  denomina  dis¬ 
tribucion  normal  estandarizada  porque  su  media  es  0  y  su  desviacion  estandar  es  1 . 
Los  valores  de  z  del  lado  izquierdo  de  la  curva  son  negativos,  en  tanto  que  los  del  lado 

derecho  son  positivos.  El  area  bajo  la  curva  normal  estandar  a  la  izquierda  de  un  valor 

especificado  de  z,  por  ejemplo  Zo,  es  la  probabilidad  P(z  <  z0).  Esta  area  acumulati- 
va  esta  registrada  en  la  tabla  3  del  apendice  I  y  se  muestra  como  el  area  sombreada  en 
la  figura  6.8.  Una  version  abreviada  de  la  tabla  3  se  da  en  la  tabla  6.1.  Observe  que  la 
tabla  contiene  valores  positivos  y  negativos  de  z.  La  columna  izquierda  de  la  tabla  da  el 
valor  de  z  correcto  al  decimo  lugar;  el  segundo  lugar  decimal  para  z,  correspondiente  a 
las  centenas,  se  da  en  el  renglon  superior. 


FIGURA  6.8 

Distribucion  normal 
estandarizada 


fiz) 


(-) 


(+) 
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Version  abreviada  de  la  tabla  3  del  apendice  I 
TABLA  6.1  tabla  3.  Areas  bajo  la  curva  normal 

z  .00  .01  .02  .03  ...  .09 


-3.4 

.0003 

.0003 

.0003 

.0003 

-3.3 

.0005 

.0005 

.0005 

.0004 

-3.2 

.0007 

.0007 

.0006 

.0006 

-3.1 

.0010 

.0009 

.0009 

.0009 

-3.0 

.0013 

.0013 

.0013 

.0012 

-2.9 

.0019 

-2.8 

.0026 

-2.7 

.0035 

-2.6 

.0047 

-2.5 

.0062 

-2.0 

.0228 

Tabla  3.  Areas  bajo  la  curva  normal  (continua) 


Z 

.00 

.01 

.02 

.03 

.04 

.09 

0.0 

.5000 

.5040 

.5080 

.5120 

.5160 

0.1 

.5398 

.5438 

.5478 

.5517 

.5557 

0.2 

.5793 

.5832 

.5871 

.5910 

.5948 

0.3 

.6179 

.6217 

.6255 

.6293 

.6331 

0.4 

.6554 

.6591 

.6628 

.6664 

.6700 

.6879 

0.5  .0915 

0.6  .7257 

0.7  .7580 

0.8  .7881 

0.9  .8159 


2.0  .9772 


Encuentre  P(z  <  1.63).  Esta  probabilidad  corresponde  al  area  a  la  izquierda  de  un  punto 
z  =  1.63  desviaciones  estandar  a  la  derecha  de  la  media  (vease  la  figura  6.9). 


CONSEJO 


P(z<  1.63)  =  P(z<  1.63) 


Solucion  El  area  esta  sombreada  en  la  figura  6.9.  Como  la  tabla  3  del  apendice  I 
da  areas  bajo  la  curva  normal  a  la  izquierda  de  un  valor  especificado  de  z,  solo  se  nece- 
sita  hallar  el  valor  tabulado  para  z=  1 .63.  Baje  por  la  columna  izquierda  de  la  tabla  hasta 
z  =  1 .6  y  en  sentido  horizontal  en  la  parte  superior  de  la  tabla  hasta  la  columna  marcada 
.03.  La  intersection  de  esta  combination  de  renglon  y  columna  da  el  area  .9484,  que  es 
P(z<  1.63). 


www.FreeLibros.me 


6.3  Areas  tabuladas  de  la  distribucion  normal  de  probabilidad  o  227 


FIGURA  6.9 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.3 


A.z) 


.9484 


1.63 


Las  areas  a  la  izquierda  de  z  =  0  se  encuentran  usando  valores  negativos  de  z. 

Encuentre  P(z.  —  —.5).  Esta  probabilidad  corresponde  al  area  a  la  derecha  de  un  punto 
z  =  —  .5  de  desviacion  estandar  a  la  izquierda  de  la  media  (vease  la  figura  6.10). 


FIGURA  6.1  0 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.4 


z 


Solucion  El  area  dada  en  la  tabla  3  es  el  area  a  la  izquierda  de  un  valor  especificado 
de  z.  Haciendo  un  indice  de  z  =  —  .5  en  la  tabla  3,  podemos  hallar  que  el  area  At  a  la 
izquierda  de  —.5  es  .3085. 

Como  el  area  bajo  la  curva  es  1 ,  encontramos 

P(z  >  -.5)  =  1  -  Ai  =  1  -.3085  =  .6915. 


Encuentre  P(  —  .5  <  z  —  1.0).  Esta  probabilidad  es  el  area  entre  z 
se  muestra  en  la  figura  6.11. 


—  .5  y  z  =  1.0,  como 


FIGURA  6.1  1 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.5 


Solucion  El  area  pedida  es  el  area  sombreada  A2  en  la  figura  6.1 1.  De  la  tabla  3  del 
apendice  I,  se  puede  hallar  el  area  a  la  izquierda  de  z  =  ~  -5  {Al  =  .3085)  y  el  area  a  la 
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izquierda  de  z  =  10  (A{  +  A2  =  .8413).  Para  hallar  el  area  marcada  A2,  restamos  las  dos 
entradas: 

A2  =  (A,  +  A2)  -  A!  =  .8413  -  .3085  =  .5328 
Esto  es,  P{—. 5  <  z  —  1.0)  =  .5328. 


^Corno  uso  la  tabla  3  para  calcular  probabilidades 
bajo  la  curva  normal  estandar? 


•  Para  calcular  el  area  a  la  izquierda  de  un  valor  z„  encuentre  el  area  directa- 
mente  de  la  tabla  3. 

•  Para  calcular  el  area  a  la  derecha  de  un  valor  z,  encuentre  el  area  en  la  tabla  3 
y  restela  de  1 . 

•  Para  calcular  el  area  entre  dos  valores  de  z,  encuentre  las  dos  areas  en  la 
tabla  3  y  reste  un  area  de  la  otra. 

Repertorio  de  ejercicios 

Considere  una  variable  aleatoria  estandar  con  media  /x  =  0  y  desviacion  estandar 
cr  =  1.  Use  la  tabla  3  y  llene  las  probabilidades  en  la  tabla  siguiente.  La  tercera 
probabilidad  ya  esta  calculada. 


El  intervalo 

Escriba  la 
probabilidad 

Reescriba  la  probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

Menor  que  1.5 

P(z<  ) 

Mayor  que  2 

P(z>  ) 

Mayor  que  2.33 

P(z>  2.33  ) 

1  -  P[x  <  2.33) 

Entre  — 1.96  y  1.96 

P{  <z<  ) 

Entre  -1.24  y  2.37 

P(  <z<  ) 

Menor  o  igual  a  -1 

P(Z£  1 

Informe  de  progreso 

•  ■  Today  fa  tiene  problemas?  Trate  de  nuevo  usando  el  Repertorio  de  ejercicios 
del  final  de  esta  seccion. 

•  ^Ya  domina  la  tabla  z?  Puede  saltarse  el  Repertorio  de  ejercicios  del  final  de 
esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 


Encuentre  la  probabilidad  de  que  una  variable  aleatoria  normalmente  distribuida  caiga 
dentro  de  estos  intervalos: 


1 .  Una  desviacion  estandar  de  su  media 

2.  Dos  desviaciones  estandar  de  su  media 
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Solucion 

1 .  Como  la  variable  aleatoria  normal  estandar  z  mide  la  distancia  desde  la  media  en 
unidades  de  desviaciones  estandar,  es  necesario  hallar 

P(-l  1)  =  .8413  -  .1587  =  .6826 

Recuerde  que  usted  calcula  el  area  entre  dos  valores  z  al  restar  las  entradas  tabu¬ 
ladas  para  los  dos  valores. 

2.  Al  igual  que  en  la  parte  1,  P(— 2  <  z  <  2)  =  .9772  —  .0228  =  .9544. 

Estas  probabilidades  concuerdan  con  valores  aproximados  de  68%  y  95%  en  la  Regia 
empfrica  del  capitulo  2. 


EJEMPLO  Encuentre  el  valor  de  z,  llamelo  Zo,  tal  que  .95  del  area  se  encuentre  a  no  mas  de  ±z0 

desviaciones  estandar  de  la  media. 


CONSEJO 


Conocemos  el  area.  Trabaje 
de  adentro  hacia  afuera  de 
la  tabla. 


Solucion  El  area  sombreada  de  la  figura  6.12  es  el  area  que  se  encuentra  a  no  mas 
de  ±Zo  desviaciones  estandar  de  la  media,  que  necesita  ser  igual  a  .95.  Las  “areas  de 
cola”  bajo  la  curva  no  estan  sombreadas  y  tienen  un  area  combinada  de  1  —  .95  =  .05. 
Debido  a  la  simetrfa  de  la  curva  normal,  estas  dos  areas  de  cola  tienen  la  misma  area,  de 
modo  que  Ai  =  .05/2  =  .025  en  la  figura  6.12.  Entonces,  toda  el  area  acumulativa  a  la 
izquierda  de  z0  para  igualar  Ai  +  A2  =  .95  +  .025  =  .9750.  Esta  area  se  encuentra  en  el 
interior  de  la  tabla  3  del  apendice  I  en  el  renglon  correspondiente  a  z  =  1 .9  y  la  columna 
.06.  En  consecuencia,  z0  =  1.96.  Observe  que  este  resultado  es  muy  cercano  al  valor 
aproximado,  z  =  2,  que  se  usa  en  la  Regia  empirica. 


FIGURA  6.1  2 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.7 


Calculo  de  probabilidades  para  una  variable 
aleatoria  normal  general 

Casi  todo  el  tiempo,  las  probabilidades  en  las  que  estamos  interesados  contienen  x,  una 
variable  aleatoria  normal  con  media  p,  y  desviacion  estandar  a.  Entonces  se  debe  estan- 
darizar  el  intervalo  de  interes,  escribiendolo  como  el  intervalo  equivalente  en  terminos 
de  z,  la  variable  aleatoria  normal  estandar.  Una  vez  hecho  esto,  la  probabilidad  de  interes 
es  el  area  que  se  encuentra  usando  la  distribucion  estandar  normal  de  probabilidad. 


Sea  v  una  variable  aleatoria  normalmente  distribuida  con  una  media  de  10  y  una  desvia¬ 
cion  estandar  de  2.  Encuentre  la  probabilidad  de  que  x  se  encuentre  entre  1 1  y  13.6. 
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El  intervalo  de  x  =  !  I  a  ^  =  1 3.6  debe  ser  estandarizado  usando  la  formula 
para  z.  Cuando  x  =  1 1 , 


CONSEJO 

Siempre  trace  una  figura; 
jayuda! 

x  —  fi  13.6  —  10 


x  —  fx  11  —  10 

Z  =  a  2 

y  cuando  x  =  13.6, 


La  probabilidad  deseada  es,  por  tanto,  P{. 5  <  z  <  1.8),  el  area  que  esta  entre  z  =  ■  5  y 
z  =  1.8,  como  se  muestra  en  la  figura  6.13.  De  la  tabla  3  del  apendice  I,  se  encuentra  que 
el  area  a  la  izquierda  de  z  =  .5  es  .6915,  y  el  area  a  la  izquierda  de  z  =  1.8  es  .9641.  La 
probabilidad  deseada  es  la  diferencia  entre  estas  dos  probabilidades,  es  decir, 

P(. 5  <  z  <  1.8)  =  .9641  -  .6915  =  .2726 


FIGURA  6.1  3 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.8 


El  applet  Java  llamada  Normal  Distribution  Probabilities  (Probabilidades  nor- 
males  de  distribucion)  permite  calcular  areas  bajo  una  distribucion  normal  para 
cualesquier  valores  de  p.  y  er  que  usted  seleccione.  Simplemente  escriba  la  media  y 
desviacion  estandar  apropiadas  en  las  cajas  en  la  parte  superior  del  applet,  teclee  el 
intervalo  de  interes  en  las  cajas  en  la  parte  inferior  del  applet  y  presione  “Enter”  en 
cada  paso  para  registrar  sus  cambios.  (La  tecla  “Tab”  movera  su  cursor  de  una  caja 
a  otra.)  El  area  necesaria  estara  sombreada  en  rojo  en  su  monitor  (azul  claro  en  la 
figura  6. 14)  y  la  probabilidad  esta  dada  a  la  izquierda  en  la  curva. 

•  Si  usted  necesita  un  area  bajo  la  distribucion  normal  estandar,  use  fx  =  0  y 
a  =  1. 

•  En  el  ejemplo  6.8,  necesitamos  un  area  bajo  una  distribucion  normal  con 
fx  =  10yer=2.  Observe  los  valores  de  x  y  z  ubicados  a  lo  largo  del  eje 
horizontal.  Encuentre  la  probabilidad,  P{  1 1  <  x  <  13.6)  =  P(0.5  <  z  <  1.8) 

=  .2726,  en  la  figura  6.14. 
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FIGURA  6.14 

Applet  Normal 
Distribution  Probabilities 


Estudios  realizados  demuestran  que  el  uso  de  gasolina  para  autos  compactos  vendi- 
dos  en  Estados  Unidos  esta  normalmente  distribuido,  con  una  media  de  25.5  millas 
por  galon  (mpg)  y  una  desviacion  estandar  de  4.5  mpg.  (',Que  porcentaje  de  compactos 
recorre  30  mpg  o  mas? 


Solucion  La  proporcion  de  compactos  que  recorren  30  mpg  o  mas  esta  dada  por  el 
area  sombreada  en  la  figura  6.15.  Para  resolver  este  problema,  primero  se  debe  hallar 
el  valor  z  correspondiente  a  x  =  30.  Sustituyendo  en  la  formula  para  z,  resulta 


x  -  yu.  _  30  —  25.5 
er  4.5 


El  area  A!  a  la  izquierda  de  z  =  1.0,  es  .8413  (de  la  tabla  3  del  apendice  I).  Entonces  la 
proporcion  de  compactos  que  recorren  30  mpg  o  mas  es  igual  a 

P(x  >  30)  =  1  -  P(z  <  1)  =  1  -  .8413  =  .1587 

El  porcentaje  que  rebasa  los  30  mpg  es 

100(.  1587)  =  15.87% 


FIGURA  6.1  5 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.9 


fix) 


25.5  30 


+ 


z 


0  1 
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Consulte  el  ejemplo  6.9.  En  tiempos  de  escasez  de  recursos  energeticos,  una  ventaja 
comparativa  se  da  a  un  fabricante  de  automoviles  que  puede  producir  un  auto  que  tiene 
una  economfa  de  consumo  de  combustible  considerablemente  mejor  que  los  autos  de  los 
competidores.  Si  un  fabricante  desea  desarrollar  un  auto  compacto  que  supere  95%  de 
los  compactos  actuales  en  economfa  de  combustible,  ^cual  debe  ser  el  porcentaje  de  uso 
de  gasolina  para  el  nuevo  auto? 


Solucion  El  porcentaje  x  de  uso  de  gasolina  tiene  una  distribucion  normal  con  una 
media  de  25.5  mpg  y  una  desviacion  estandar  de  4.5  mpg.  Usted  necesita  hallar  un  valor 
particular,  por  ejemplo  x0,  tal  que 


P(x  <  v0)  =  .95 

Este  es  el  95avo  percentil  de  la  distribucion  del  porcentaje  x  de  uso  de  gasolina.  Como  la 
unica  information  que  tenemos  acerca  de  las  probabilidades  normales  es  en  terminos  de 
la  variable  z  aleatoria  normal  estandar,  empiece  por  estandarizar  el  valor  de  x0: 

x0  —  25.5 
Zo  =  45 


Como  el  valor  de  Zo  corresponde  a  x0,  tambien  debe  tener  un  area  de  .95  a  su  izquier- 
da,  como  se  muestra  en  la  figura  6. 16.  Si  usted  ve  al  interior  de  la  tabla  3  del  apendice  I, 
encontrara  que  el  area  .9500  esta  exactamente  a  la  mitad  entre  las  areas  para  z  =  1.64  y 
Z  =  1.65.  Por  tanto,  Zo  debe  estar  exactamente  a  la  mitad  entre  1.64  y  1.65,  es  decir 


x0  —  25.5 
Zo  =  45 


1.645 


Al  despejar  x0  resulta 

x0  =  /a  +  Z0a  =  25.5  +  (1.645)(4.5)  =  32.9 


FIGURA  6.1  6 

Area  bajo  la  curva  normal 
estandar  para  el  ejemplo 
6.10 


El  nuevo  auto  compacto  del  fabricante  debe  recorrer,  por  tanto,  32.89  mpg  para  superar 
95%  de  los  autos  compactos  actualmente  disponibles  en  el  mercado  en  Estados  Unidos. 


El  applet  Java  llamado  Normal  Probabilities  and  z-Scores  (Probabilidades  nor¬ 
males  y  puntajes  z)  permite  calcular  areas  bajo  una  distribucion  normal,  para  cuales- 
quier  valores  de  /jl  y  erque  usted  seleccione.  Una  vez  que  especifique  un  valor  para  x, 
el  applet  calcula  el  valor  de  z,  y  uno  de  cuatro  tipos  de  areas,  que  puede  seleccionar 
de  la  lista  descendente  de  la  parte  inferior  del  applet: 
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•  Area  a  la  izquierda  =>  area  a  la  izquierda  de  z 

•  Area  a  la  derecha  =>  area  a  la  derecha  de  z 

•  Dos  colas  =>  area  en  dos  colas  cortada  por  — z  y  z 

•  Centro  =>  area  entre  — z  y  z 

Tambien  se  puede  trabajar  a  la  inversa  como  hicimos  para  resolver  el  problema  del 
ejemplo  6.10.  Introdujimos  la  media  y  desviacion  estandar  y  luego  seleccionamos 
“Area  a  la  izquierda”  con  una  probabilidad  de  .95.  Si  las  cajas  para  ryzse  dejan  en 
bianco,  presionar  “Enter”  resolvera  estos  problemas,  como  se  muestra  en  la  figura 
6.17.  (:  Cual  es  el  valor  de  x,  coiTecto  a  cinco  lugares  decimales? 


FIGURA  6.1  7 

Applet  Normal 
Probabilities  and 
z-Scores 


x  Mean 

i  «in34ri  . 

1  MS  _ _ 

1 4.5  Strin*v 


Recuerde  que  el  applet  esta  programada  para  calcular  probabilidades  usando  un  valor 
de  z  con  completa  precision  decimal.  Si  el  usuario  escoge  redondear  una  z  calculada 
al  centesimo  mas  cercano,  de  modo  que  pueda  usar  la  tabla  3  del  apendice  I,  puede 
obtener  una  probabilidad  ligeramente  diferente  a  la  calculada  usando  el  applet. 
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EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  ref i ere  n  a  la  seccion  Mi  en  tree  ad  or  personal  de  la  pagina  228. 

6.1  Considere  una  variable  aleatoria  estandar  con  p,  =  0  y  desviacion  estandar  er  =  1.  Use 
la  tabla  3  y  llene  las  probabilidades  siguientes. 


El intervalo 

Escriba  la 
probabilidad 

Reescriba  la  probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

Menor  que  -2 

P(z<  ) 

Mayor  que  1.16 

P(z>  ) 

Mayor  que  1.645 

P(z>  ) 

Entre  -2.33  y  2.33 

P(  <z<  ) 

Entre  1.24  y  2.58 

P(  <z<  ) 

Menor  o  igual  a  1.88 

P(z<  ) 
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6.2  Repita  el  ejercicio  6.1.  Use  la  tabla  3  y  complete  a  continuacion  las  probabilidades. 


El  intervalo 

Escriba  la 
probabilidad 

Reescriba  la  probabilidad 
(si  es  necesario) 

Encuentre  la 
probabilidad 

Mayor  que  5 

P(z>  ) 

Entre  -3  y  3 

P(  <z<  ) 

Entre  -.5  y  1.5 

P(  <  z  <  ) 

Menor  o  igual  a  -6.7 

P(z  —  ) 

Menor  a  2.81 

P(z<  ) 

Mayor  que  2.81 

P(z>  ) 

TECNICAS  BASICAS 

6.3  Calcule  el  area  bajo  la  curva  normal  estandar  a  la 
izquierda  de  estos  valores: 

a.  z  =  1.6  b.  z  =  1.83 

c.  z  =  .90  d.  z  =  4.18 

6.4  Calcule  el  area  bajo  la  curva  normal  estandar  a  la 
izquierda  de  estos  valores: 

a.  z  =  — 1.4  y  z  =  1.4  b.  z  =  — 3.0  y  z  =  3.0 

6.5  Encuentre  las  siguientes  probabilidades  para  la 
variable  aleatoria  normal  estandar  z: 

a.  P(-1.43  <z<  .68)  b.  P(.58  <  z  <  1.74) 

c.  J°(— 1.55  <z<  -.44)  d.  P(z  >  1.34) 
e.  P(z  <  -4.32) 

6.6  Encuentre  las  siguientes  probabilidades  para  la 
variable  aleatoria  normal  estandar  z: 

a.  P(z  <  2.33)  b.  P(z  <  1.645) 

c.  P(z  >  1.96)  d.  P(— 2.58  <  z  <  2.58) 

6.7  a.  Encuentre  una  z0  tal  que  P(z  >  z0)=  .025. 

b.  Encuentre  una  zo  tal  que  P(z  <  Zo)=  -925 1 . 

6.8  Encuentre  una  Zo  tal  que  P(— z0  <  z  <  z0)=  .8262. 

6.9  a.  Encuentre  una  z0  que  tenga  area  .9505  a  su  izquierda. 

b.  Encuentre  una  z0  tal  que  .05  a  su  izquierda. 

6.10  a.  Encuentre  una  zo  tal  que  P( — z.t,  <  z  <  Zo)=  -90. 

b.  Encuentre  una  zo  tal  que  P( — z0  <  z  <  z0)=  -99. 

6.1 1  Encuentre  los  siguientes  percentiles  para  la 
variable  aleatoria  normal  estandar  z: 

a.  90avo  percentil.  b.  95avo  percentil. 

c.  98avo  percentil.  d.  99avo  percentil. 

6.12  Una  variable  aleatoria  normal  x  tiene  media 
fx  =  10  y  desviacion  estandar  cr  =  2.  Encuentre  las 
probabilidades  de  estos  valores  x : 

a.  x  >  13.5  b.  x  <  8.2  c.  9.4  <  x  <  10.6 


6.13  Una  variable  aleatoria  normal  x  tiene  media 

/x  =  1.20  y  desviacion  estandar  cr  =  .15.  Encuentre  las 
probabilidades  de  estos  valores  x: 

a.  1.00  <  x  <  1.10  b.  x  >  1.38 

c.  1.35  <  x  <  1.50 

6.14  Una  variable  aleatoria  normal  x  tiene  una 
media  /x  desconocida  y  desviacion  estandar  cr  =  2. 

Si  la  probabilidad  que  x  exceda  de  7.5  es  .8023, 
encuentre  /x. 

6. 1 5  Una  variable  aleatoria  normal  x  tiene  media  de  35 
y  desviacion  estandar  10.  Encuentre  un  valor  de  x  que 
tenga  area  .01  a  su  derecha.  Este  es  el  99avo  percentil  de 
su  distribucion  normal. 

6.16  Una  variable  aleatoria  normal  x  tiene  media  de  50 
y  desviacion  estandar  10.  (\Sena  poco  comun  ver  el  valor 
x  =  0?  Explique  su  respuesta. 

6.17  Una  variable  aleatoria  normal  x  tiene  una  media 
y  desviacion  estandar  desconocidas.  La  probabilidad  de 
que  x  exceda  de  4  es  .9772  y  la  probabilidad  de  que  x 
exceda  de  5  es  .9332.  Encuentre  pu  y  cr. 

APLICACIONES 

6.18  Carne  para  hamburguesa  El  departamento 
de  carnes  en  un  supermercado  local  especificamente 
prepara  sus  paquetes  de  “1  libra”  de  carne  molida,  para 
que  haya  una  variedad  de  pesos,  algunos  ligeramente  mas 
y  otros  ligeramente  menos  de  1  libra.  Suponga  que  los 
pesos  de  estos  paquetes  de  “1  libra”  estan  normalmente 
distribuidos  con  una  media  de  1 .00  libra  y  una  desviacion 
estandar  de  .15  libras. 

a.  <',Que  proporcion  de  los  paquetes  pesara  mas  de  una 
libra? 

b.  (iQuc  proporcion  de  los  paquetes  pesara  entre  .95  y 
1.05  libras? 

c.  <',CuaI  es  la  probabilidad  de  que  un  paquete  de 
carne  molida  seleccionado  al  azar  pese  menos 
de  .80  libras? 
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d.  /.Serf  a  poco  comun  hallar  un  paquete  de  came  molida 
que  pese  1.45  libras?  ('  C6mo  explicana  usted  un 
paquete  tan  grande? 

6.19  Estatura  en  personas  Las  estaturas  en  personas 
son  unas  de  las  muchas  variables  biologicas  que  pueden 
ser  modeladas  por  la  distribucion  normal.  Suponga 

que  las  estaturas  de  hombres  tienen  una  media  de  69 
pulgadas,  con  una  desviacion  estandar  de  3.5  pulgadas. 

a.  ^Que  proporcion  de  todos  los  hombres  sera  mas  alta 
de  6'0"?  (sugerencia:  Convierta  las  mediciones  a 
pulgadas.) 

b.  ('Cual  es  la  probabilidad  de  que  un  hombre 
seleccionado  al  azar  mida  entre  5'8"  y  6'  1"? 

c.  El  presidente  George  W.  Bush  mide  5' 1 1"  de  estatura. 
I  Es  esta  una  estatura  poco  comun? 

d.  De  los  42  presidentes  elegidos  de  1789  a  2006,  18 
median  6'0"  o  mas.1  ^Considerana  usted  esto  como 
poco  comun,  dada  la  proporcion  hallada  en  el 
inciso  a)? 

6.20  Arboles  de  Navidad  Los  diametros  de 
abetos  Douglas  cultivados  en  una  granja  de  arboles  de 
Navidad  estan  normalmente  distribuidos,  con  una  media 
de  4  pulgadas  y  una  desviacion  estandar  de  1.5  pulgadas. 

a.  (iQuc  proporcion  de  los  arboles  tendra  diametros  entre 
3  y  5  pulgadas? 

b.  ^Que  proporcion  de  los  arboles  tendra  diametros 
menores  a  3  pulgadas? 

c.  El  pedestal  del  arbol  de  Navidad  de  usted  se  expandira 
a  un  diametro  de  6  pulgadas.  (',Que  proporcion  de 

los  arboles  no  cabran  en  el  pedestal  de  su  arbol 
de  Navidad? 

6.21  Circulacion  sanguinea  cerebral  La 

circulacion  sangumea  cerebral  (CBF),  en  los  cerebros 
de  personas  sanas,  esta  normalmente  distribuida  con  una 
media  de  74  y  desviacion  estandar  de  16. 

a.  ^Que  proporcion  de  personas  sanas  tendran  lecturas  de 
CFG  entre  60  y  80? 

b.  (',Quc  proporcion  de  personas  sanas  tendran  lecturas  de 
CFG  arriba  de  100? 

c.  Si  una  persona  tiene  una  lectura  CBF  debajo  de  40, 
es  clasificado  como  en  riesgo  de  sufrir  un  ataque 
cerebral,  i  A  que  proporcion  de  personas  sanas  se  les 
diagnosticara  erroneamente  como  “en  riesgo”? 

6.22  Distancias  de  frenado  Para  un  auto  que  corre 
a  30  millas  por  hora  (mph),  la  distancia  necesaria  de 
frenado  hasta  detenerse  por  completo  esta  normalmente 
distribuida  con  media  de  50  pies  y  desviacion  estandar  de 
8  pies.  Suponga  que  usted  esta  viajando  a  30  mph  en  una 
zona  residencial  y  un  auto  se  mueve  en  forma  abrupta  en 
el  camino  de  usted,  a  una  distancia  de  60  pies. 


a.  Si  usted  aplica  los  frenos,  ^cual  es  la  probabilidad 
de  que  frene  hasta  detenerse  en  no  mas  de  40  pies  o 
menos?  <,Y  en  no  mas  de  50  pies  o  menos? 

b.  Si  la  unica  forma  de  evitar  una  colision  es  frenar  hasta 
detenerse  por  completo,  ^cual  es  la  probabilidad  de 
que  evite  la  colision? 

6.23  Capacidades  en  elevadores  Supongamos 
que  usted  debe  establecer  reglas  respecto  al  numero 
maximo  de  personas  que  pueden  ocupar  un  elevador.  Un 
estudio  de  lugares  ocupados  en  un  elevador  indica  que 

si  ocho  personas  ocupan  el  elevador,  la  distribucion  de 
probabilidad  del  peso  total  de  las  ocho  personas  tiene  una 
media  igual  a  1200  libras  y  una  desviacion  estandar  de 
99  libras.  <Cual  es  la  probabilidad  de  que  el  peso  total 
de  ocho  personas  exceda  de  1300  libras?  (jY  de  1500 
libras?  (Suponga  que  la  distribucion  de  probabilidad  es 
aproximadamente  normal.) 

6.24  Una  mina  de  fosfato  La  descarga  de  solidos 
suspendidos  desde  una  mina  de  fosfato  esta  normalmente 
distribuida,  con  una  descarga  media  diaria  de  27 
miligramos  por  litro  (mg/1)  y  una  desviacion  estandar  de 
14  mg/1.  ,',Que  proporcion  de  dfas  excedera  de  50  mg/1  la 
descarga  diaria? 

6.25  Girasoles  Un  experimentador  que  hace 
publicidad  en  la  publication  Annals  of  Botany  investigo 
si  los  diametros  de  tallos  del  girasol  dicotiledonea 
cambiarfa,  dependiendo  de  si  la  planta  fue  dejada 

para  balancearse  libremente  en  el  viento  o  estaba 
artificialmente  sostenida.2  Suponga  que  los  diametros 
de  tallos  no  soportados  en  la  base,  de  una  especie 
particular  de  girasol,  tienen  una  distribucion  normal  con 
un  diametro  promedio  de  35  milfmetros  (mm)  y  una 
desviacion  estandar  de  3  mm. 

a.  (,Cual  es  la  probabilidad  de  que  una  planta  de  girasol 
tenga  un  diametro  de  base  de  mas  de  40  mm? 

b.  Si  dos  plantas  de  girasol  se  seleccionan  al  azar,  ^cual 
es  la  probabilidad  de  que  ambas  plantas  tengan  un 
diametro  de  base  de  mas  de  40  mm? 

c.  <,Dentro  de  que  llmites  esperana  usted  que  se 
encuentren  los  diametros  de  base,  con  probabilidad  .95? 

d.  (iQuc  diametro  representa  el  90avo  percentil  de  la 
distribucion  de  diametros? 

6.26  Frecuencia  respiratoria  El  numero  de  veces  x 
que  un  humano  adulto  respira  por  minuto,  cuando  esta 
en  reposo,  depende  de  su  edad  y  vana  en  gran  medida 
de  una  persona  a  otra.  Suponga  que  la  distribucion  de 
probabilidad  para  x  es  aproximadamente  normal,  con  la 
media  igual  a  16  y  la  desviacion  estandar  igual  a  4.  Si 
una  persona  se  selecciona  al  azar  y  se  registra  el  numero 
x  de  respiraciones  por  minuto  cuando  esta  en  reposo, 
^cual  es  la  probabilidad  de  que  x  exceda  de  22? 
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6.27  Pronosticos  economicos  Un  metodo  para  llegar  a 
pronosticos  economicos  es  usar  una  propuesta  de  consensos. 
Se  obtiene  un  pronostico  de  cada  uno  de  un  numero  grande 
de  analistas  y  el  promedio  de  estos  pronosticos  individuates 
es  el  pronostico  de  consenso.  Suponga  que  los  pronosticos 
individuales  de  la  tasa  de  interes  preferente  de  enero  de 
2008,  hechos  por  analistas  economicos,  estan  normalmente 
distribuidos  en  forma  aproximada  con  la  media  igual  a 
8.5%  y  una  desviacion  estandar  igual  a  .02%.  Si  al  azar 

se  selecciona  un  solo  analista  de  entre  este  grupo,  (cual  es 
la  probabilidad  de  que  el  pronostico  del  analista  de  la  tasa 
preferente  tome  estos  valores? 

a.  Rebase  de  8.75%. 

b.  Sea  menor  a  8.375%. 

6.28  Auditori'a  de  impuestos  /,En  que  forma 
determina  el  IRS  (Hacienda)  el  porcentaje  de  devoluciones 
de  impuesto  al  ingreso  para  auditar  a  cada  estado? 

Suponga  que  lo  hacen  al  azar,  seleccionando  50  valores  de 
entre  una  distribucion  normal  con  una  media  igual 

a  1.55%  y  una  desviacion  estandar  igual  a  .45%.  (Existen 
programas  de  computo  para  este  tipo  de  muestreo.) 

a.  ('Cual  es  la  probabilidad  de  que  un  estado  particular 
tenga  mas  de  2.5%  de  sus  devoluciones  de  impuesto  al 
ingreso  auditadas? 

b.  C u a  1  es  la  probabilidad  de  que  un  estado  tenga  menos 
de  1  %  de  sus  devoluciones  de  impuesto  al  ingreso 
auditadas? 

6.29  Bacterias  en  agua  potable  Suponga  que  los 
mimeros  de  un  tipo  particular  de  bacterias,  en  muestras 
de  1  mililitro  (ml)  de  agua  potable,  tienden  a  estar 
normalmente  distribuidos  en  forma  aproximada  con 
media  de  85  y  desviacion  estandar  de  9.  ^Cual  es  la 
probabilidad  de  que  una  muestra  determinada  de  1  ml 
contenga  mas  de  100  bacterias? 

6.30  Carga  de  granos  Un  cargador  de  granos  se 
puede  ajustar  para  descargar  granos  en  cantidades  que 
estan  normalmente  distribuidas,  con  media  de  /x  bushels  y 
desviacion  estandar  de  25.7  bushels.  Si  una  compania  desea 
usar  el  cargador  para  llenar  contenedores  de  2000  bushels 
de  grano  y  llenar  de  mas  solo  un  contenedor  en  100,  (a  que 
valor  de  /x  debe  la  compania  ajustar  el  cargador? 

6.31  iCuantas  palabras?  Un  editor  ha  descubierto 
que  los  numeros  de  palabras  contenidos  en  un  nuevo 
manuscrito  estan  normalmente  distribuidos,  con  una 
media  igual  a  20  mil  palabras  mas  de  las  especificadas 
en  el  contrato  del  autor  y  una  desviacion  estandar  de 
10  mil  palabras.  Si  el  editor  desea  estar  casi  seguro 
(digamos  con  una  probabilidad  de  .95)  que  el  manuscrito 
tenga  menos  de  100  mil  palabras,  (:,que  numero  de 
palabras  debe  especificar  el  editor  en  el  contrato? 


6.32  l Alguien  juega  tenis?  Un  fabricante  de 
raquetas  de  tenis  ha  encontrado  que  la  traccion  real  de  las 
cuerdas,  alcanzada  para  cualquier  encordado  individual 
de  raquetas,  va  a  variar  hasta  en  6  libras  por  pulgada 
cuadrada  con  respecto  a  la  traccion  deseada  lijada  en  la 
maquina  ensambladora.  Si  el  fabricante  desea  montar 
cuerdas  a  una  traccion  menor  que  la  especificada  por  un 
cliente  solo  5%  del  tiempo,  ^cuanto  mas  arriba  o  abajo  de 
la  traccion  especificada  por  el  cliente  el  fabricante  debe 
fijar  la  maquina  ensambladora?  (nota:  Suponga  que  la 
distribucion  de  tracciones  de  las  cuerdas  producida  por  la 
maquina  ensambladora  esta  normalmente  distribuida,  con 
una  media  igual  a  la  traccion  fijada  en  la  maquina  y  una 
desviacion  estandar  igual  a  2  libras  por  pulgada  cuadrada.) 

6.33  Compras  en  un  centro  comercial  Un  artlculo 
en  el  American  Demographics  dice  que  mas  del  doble  de 
compradores  salen  de  compras  los  fines  de  semana  que 
durante  la  semana.3  No  solo  eso,  porque  esos  compradores 
tambien  gastan  mas  dinero  en  sus  compras  en  sabados 

y  domingos.  Suponga  que  la  cantidad  de  dinero  gastada 
en  centros  comerciales,  entre  las  4  p.m.  y  las  6  p.m.  los 
domingos  tiene  una  distribucion  normal  con  media  de 
$85  y  una  desviacion  estandar  de  $20.  Un  comprador  se 
selecciona  al  azar  un  domingo  entre  las  4  p.m.  y  las  6  p.m. 
y  se  le  pregunta  sobre  su  forma  de  gastar. 

a.  (iCual  es  la  probabilidad  de  que  el  hay  a  gastado  mas 
de  $95  en  el  centro  comercial? 

b.  (,Cual  es  la  probabilidad  de  que  el  haya  gastado  entre 
$95  y  $1 15  en  el  centro  comercial? 

c.  Si  dos  compradores  se  seleccionan  al  azar,  /Cual  es 
la  probabilidad  de  que  ambos  compradores  hayan 
gastado  mas  de  $1 15  en  el  centro  comercial? 

6.34  Frecuencia  de  pulsaciones  La  frecuencia  de 
pulsaciones  es  una  medida  del  numero  de  pulsaciones  del 
corazon  en  un  minuto.  Se  puede  medir  en  varios  lugares 
del  cuerpo,  donde  una  arteria  pasa  cerca  de  la  piel.  Una  vez 
que  encuentre  el  pulso,  cuente  el  numero  de  pulsaciones  por 
minuto,  es  decir,  cuente  durante  30  segundos  y  multiplique 
por  dos.  (',Cual  es  una  frecuencia  de  pulsaciones  normal ?  Eso 
depende  de  varios  factores.  Las  frecuencias  de  pulsaciones 
entre  60  y  100  pulsaciones  por  minuto  se  consideran 
normales  para  ninos  de  mas  de  10  anos  de  edad  y  en 
adultos.4  Suponga  que  estas  frecuencias  de  pulsaciones  estan 
distribuidas  normalmente  en  forma  aproximada,  con  una 
media  de  78  y  una  desviacion  estandar  de  12. 

a.  ^Que  proportion  de  adultos  tendra  frecuencias  de 
pulsaciones  entre  60  y  100? 

b.  (iCuaI  es  el  95avo  percentil  para  las  frecuencias  de 
pulsaciones  de  adultos? 

c.  (',Una  frecuencia  de  pulsaciones  de  1 10  serfa 
considerada  poco  comun?  Explique. 
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LA  APROXIMACION  NORMAL 
A  LA  DISTRIBUCION  DE  PROBABILIDAD 
BINOMIAL  (OPCIONAL) 

En  el  capitulo  5  aprendimos  tres  formas  de  calcular  probabilidades  para  la  variable  bino¬ 
mial  aleatoria  x. 


•  Con  el  uso  de  la  formula  binomial,  Fix  =  k)  =  C'lp'q"  k 

•  Con  el  uso  de  las  tablas  acumulativas  binomiales 

•  Con  el  uso  de  applets  Java 


La  formula  binomial  produce  calculos  largos  y  las  tablas  se  pueden  adquirir  solo  para 
ciertos  valores  de  n  y  p.  Hay  otra  opcion  cuando  np  <7;  las  probabilidades  de  Poisson 
se  pueden  usar  para  aproximar  Fix  =  k ).  Cuando  esta  aproximacion  no  funciona  y  n  es 
grande,  la  distribucion  normal  de  probabilidad  da  otra  aproximacion  para  probabilida¬ 
des  binomiales. 


LA  APROXIMACION  NORMAL  A  LA  DISTRIBUCION 
DE  PROBABILIDAD  BINOMIAL 

Sea  x  la  variable  binomial  aleatoria  con  n  intentos  y  probabilidad  p  de  exito.  La  dis¬ 
tribucion  de  probabilidad  de  x  se  aproxima  mediante  el  uso  de  una  curva  normal  con 

p  =  np  y  a  =  yjnpq 

Esta  aproximacion  es  adecuada  mientras  n  sea  grande  y  p  no  este  demasiado  cerca 
de  0  o  1 . 

Como  la  distribucion  normal  es  continua,  el  area  bajo  la  curva  en  cualquier  punto 
individual  es  igual  a  0.  Recuerde  que  este  resultado  se  aplica  solo  a  variables  aleatorias 
continuas.  Como  la  variable  binomial  aleatoria  x  es  una  variable  aleatoria  discreta,  la 
probabilidad  de  que  x  tome  algun  valor  especifico,  por  ejemplo  x  =  1 1,  no  necesaria- 
mente  sera  igual  a  0. 

Las  figuras  6.18  y  6.19  muestran  los  histogramas  binomiales  de  probabilidad  para 
n  =  25  con  p  =  .5  y  p  =  .1,  respectivamente.  La  distribucion  en  la  figura  6.18  es  exac- 
tamente  simetrica. 


FinilRA  P.  IS 


7.5  10.5 
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Si  usted  superpone  una  curva  normal  con  la  misma  media,  p,  =  np,  y  la  misma  desvia- 
cion  estandar,  cr  =  \jnpq ,  sobre  la  parte  superior  de  las  barras,  “se  ajusta”  muy  bien;  esto 
es,  las  areas  bajo  la  curva  son  casi  iguales  a  las  areas  bajo  las  barras.  No  obstante,  cuando 
la  probabilidad  de  exito,  p,  es  pequena  y  la  distribucion  esta  sesgada,  como  se  muestra 
en  la  figura  6.19,  la  curva  normal  simetrica  ya  no  ajusta  muy  bien.  Si  tratamos  de  usar 
las  areas  de  la  curva  normal  para  aproximar  el  area  bajo  las  barras,  la  aproximacion  no 
sera  muy  buena. 


Use  la  curva  normal  para  aproximar  la  probabilidad  de  que  x  =  8,  9  o  10  para  una  varia¬ 
ble  aleatoria  binomial  con  n  =  25  y  p  =  .5.  Compare  esta  aproximacion  a  la  probabilidad 
binomial  exacta. 


Solucion  Se  puede  hallar  la  probabilidad  binomial  exacta  para  este  ejemplo  porque 
hay  tablas  binomiales  acumulativas  para  n  =  25.  De  la  tabla  1  del  apendice  I, 

P(x  =  8,  9  o  10)  =  P(x  <  10)  -  P(x  <  7)  =  .212  -  .022  =  .190 

Para  usar  la  aproximacion  normal,  primero  encuentre  la  media  apropiada  y  desviacion 
estandar  para  la  curva  normal: 

(jl  =  np  =  25(.5)  =  12.5 

cr  =  \fnpq  =  \Jl5(.5)(.5)  =  2.5 


CONSEJO 


Solo  use  la  correccion  de 
continuidad  jsi  xtiene  una 
distribucion  binomial! 


La  probabilidad  que  usted  necesita  corresponde  al  area  de  los  tres  rectangulos  que  se 
encuentran  en  x  =  8,  9  y  10.  El  area  equivalente  bajo  la  curva  normal  se  encuentra  entre 
x  =  7.5  (el  lado  inferior  del  rectangulo  para  x  =  8)  y  jc  =  10.5  (el  lado  superior  del  rec- 
tangulo  para  v  =  10).  Esta  area  esta  sombreada  en  la  figura  6.18. 
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Para  hallar  la  probabilidad  normal,  siga  los  procedimientos  de  la  section  6.3.  Primero 
estandarice  el  punto  extremo  de  cada  intervalo: 


z  = 


7.5  -  12.5 
2 5 


-2.0 


x  —  p  10.5  -  12.5 

Z  = - = - - =  — 

er  2.5 

A  continuation  la  probabilidad  aproximada  (sombreada  en  la  figura  6.20)  se  encuentra 
de  la  tabla  3  del  apendice  I: 

P(— 2.0  <  z  <  -.8)  =  .2119  -  .0228  =  .1891 

Se  puede  comparar  la  aproximacion,  .1891,  con  la  probabilidad  real,  .190.  Son  muy  cer- 
canas. 


FIGURA  6.20 

Area  bajo  la  curva  normal 
para  el  ejemplo  6.11 


Ax) 


X 

7.5  10.5  12.5 

— i - 1 - 1 - z 

-2.0  -.8  0 


Se  puede  usar  el  applet  Java  llamada  Normal  Approximation  to  Binomial  Pro¬ 
babilities  (Aproximacion  Normal  a  Probabilidades  Binomiales),  que  se  mues- 
tra  en  la  figura  6.21,  para  comparar  las  probabilidades  reales  y  aproximadas  para 
la  distribution  binomial  del  ejemplo  6.1 1.  Introduzca  los  valores  apropiados  de  n  y 
p  y  en  las  cajas  en  la  esquina  superior  izquierda  del  applet,  y  presione  “Enter”  para 
registrar  cada  una  de  las  entradas.  La  distribution  binomial  exacta  a  la  izquierda  del 
applet  cambiara,  dependiendo  del  valor  de  n  que  se  haya  introducido.  A  continuation 
cambie  el  valor  de  k  en  la  caja  en  la  esquina  inferior  izquierda  del  applet  y  presione 
“Enter”.  El  applet  calculara  la  probabilidad  binomial  exacta  P(x  <  k )  en  la  caja  mar- 
cada  “Prob”:  Tambien  calculara  la  probabilidad  aproximada  usando  el  area  bajo  la 
curva  normal.  El  valor  z,  con  la  correction  de  continuidad,  se  muestra  arriba  a  la  dere- 
cha  y  la  probabilidad  aproximada  se  muestra  a  la  izquierda  de  la  curva  normal.  Para 
el  ejemplo  6.11,  el  applet  calcula  la  aproximacion  normal  como  P(x  <  10)  ~  .2119. 
^Cual  es  el  valor  exacto  de  P(x  <  10)?  Si  se  cambia  k  a  7  y  se  presiona  “Enter”,  ^cual 
es  el  valor  aproximado  para  P(x  <  7)?  Ahora  calcule  P( 8  <  x  ^  10).  ^Se  compara 
con  la  respuesta  que  obtuvimos  en  el  ejemplo  6.11?  Usaremos  este  applet  de  nuevo 
para  la  section  de  Ejercicios  MiApplet  al  final  de  este  capitulo. 
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FIGURA  6.21 

Applet  Normal 
Approximation  to 
Binomial  Probabilities 
(Aproximacion  normal 
a  probabilidades 
binomiales) 


n:  [2! T 


foF" 


0.25  PM 
0.2 


k:  10 


Prcib:  0.2122 


-0.8 


10.5 


F' rob  =0.2119 


10.5 

-0.8 


M  o  a  n 


12.5 


2.5  Std  Dev 


Usted  debe  tener  cuidado  de  no  excluir  la  mitad  de  los  dos  rectangulos  de  probabilidad 
extremos,  cuando  use  la  aproximacion  normal  a  la  distribucion  binomial  de  probabili¬ 
dad.  Este  ajuste,  llamado  correction  de  continuidad,  ayuda  a  considerar  el  hecho  de 
que  usted  se  aproxima  a  una  variable  aleatoria  discreta  con  una  continua.  Si  olvida  la 
correccion,  su  aproximacion  no  sera  muy  buena.  Use  esta  correccion  solo  para  probabi¬ 
lidades  binomiales ;  no  trate  de  usarla  cuando  la  variable  aleatoria  ya  sea  continua,  por 
ejemplo  una  estatura  o  un  peso. 

(  Como  saber  cuando  es  apropiado  usar  la  aproximacion  normal  a  probabilidades 
binomiales?  La  aproximacion  normal  funciona  bien  cuando  el  histograma  binomial 
es  casi  simetrico.  Esto  ocurre  cuando  la  distribucion  binomial  no  esta  “agrupada”  cerca 
de  0  o  n,  es  decir,  cuando  se  puede  dispersar  al  menos  dos  desviaciones  estandar  desde 
su  media  sin  exceder  sus  limites,  0  y  n.  Usando  este  criterio,  se  puede  deducir  esta  sen- 
cilla  regia  practica: 


REGLA  PRACTICA 

La  aproximacion  normal  a  las  probabilidades  binomiales  sera  adecuada  si 
np  >  5  y  nq  >  5 


m 


ENTRENADOR  PERSONAL 

i,C6mo  calculo  probabilidades  binomiales  usando 
la  aproximacion  normal? 


•  Encuentre  los  valores  necesarios  de  n  y  p.  Calcule  p,  =  npy  a  =  \fnpq. 

•  Escriba  la  probabilidad  que  necesite  en  terminos  de  x  y  localice  el  area  apro- 
piada  en  la  curva. 

•  Corrija  el  valor  de  x  en  ±  .5  para  incluir  todo  el  bloque  de  probabilidad  para 
ese  valor.  Esta  es  la  correccion  de  continuidad. 
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•  Convierta  los  valores  x  necesarios  a  valores  z  usando 

_  x  ±  .5  —  np 
\Jnpq 

•  Use  la  tabla  3  del  apendice  I  para  calcular  la  probabilidad  aproximada. 


Repertorio  de  ejercicios 

Considere  una  variable  aleatoria  binomial  con  n  =  30  y  p  =  .4.  Llene  los  siguientes  espacios 
en  bianco  para  hallar  algunas  probabilidades  usando  la  aproximacion  normal. 


A.  Pasos  preliminares: 

1 .  (■.Podemos  usar  la  aproximacion  normal?  Calcule  np  = _ y  nq  = _ 

2.  inp  y  nq  son  mayores  a  5?  Si _  No _ 

3.  Si  la  respuesta  a  la  pregunta  2  es  positiva,  calcule  /jl  =  np  = _ y 

cr  =  y/npq  = _ 

B.  Calcule  la  probabilidad: 

1 .  Para  hallar  la  probabilidad  de  20  o  mas  exitos,  /.quc  valores  de  x  deben  estar 
incluidos?  x  = _ . 


2. 

3. 

4. 


Para  incluir  todo  el  bloque  de  probabilidad  para  el  primer  valor  de  x  =  . 
empiece  en _ . 


Calcule  z  = 


x  ±  .5  ~  np 


\fnpq 

Calcule  P(x  >  20)  =  P(z  > 


_)  =  1  - 


Informe  de  progreso 

•  ■  Todav fa  tiene  problemas?  Trate  de  nuevo  usando  el  Repertorio  de  ejercicios 
del  final  de  esta  seccion. 

•  'Ya  domina  la  aproximacion  normal?  Puede  saltarse  el  Repertorio  de  ejerci¬ 
cios  del  final  de  esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 


EJEMPLO 


La  confiabilidad  de  un  fusible  electrico  es  la  probabilidad  de  que  un  fusible,  escogido  al 
azar  de  la  produccion,  funcione  bajo  sus  condiciones  de  diseno.  Una  muestra  aleatoria 
de  1000  fusibles  se  probo  y  se  observaron  x  =  27  defectuosos.  Calcule  la  probabilidad 
aproximada  de  observar  27  o  mas  defectuosos,  suponiendo  que  la  confiabilidad  de  un 
fusible  es  .98. 


CONSEJO 


Si  np  y  nq  son  mayores  a  5,  se 
puede  usar  la  aproximacion 
normal. 


Solucion  La  probabilidad  de  observar  uno  defectuoso  cuando  un  solo  fusible  se 
prueba  es  p  =  .02,  dado  que  la  confiabilidad  del  fusible  es  .98.  Entonces 

p,  =  np  =  1000(.02)  =  20 

a  =  \fnpq  =  Vl000(.02)(.98)  =  4.43 

La  probabilidad  de  27  o  mas  fusibles  defectuosos,  dada  n  =  1000,  es 

P(x  >  27)  =  p(¥l)  +  p( 28)  +  p{ 29)  +  •  •  •  +  p{ 999)  +  p(1000) 
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FIGURA  6.22 

Aproximacion  normal  a  la 
binomial  para  el  ejemplo 
6.12 


Es  apropiado  usar  la  aproximacion  normal  a  la  probabilidad  binomial  porque 

np  =  1000(.02)  =  20  y  nq  =  1000(.98)  =  980 

son  may  ores  a  5.  El  area  normal  empleada  para  aproximar  P(x  >  27)  es  el  area  bajo 
la  curva  normal  a  la  derecha  de  26.5,  de  modo  que  todo  el  rectangulo  para  x  =  27  esta 
incluido.  Entonces,  el  valor  z  correspondiente  a  x  =  26.5  es 

_  x  —  pc  _  26.5  —  20  _  6.5  _ 

4  _  a  443  _  443  _ 

y  el  area  a  la  izquierda  de  z  =  147  es  .9292,  como  se  muestra  en  la  figura  6.22.  Como  el 
area  total  bajo  la  curva  es  1 ,  tenemos 

P(x  >  27)  «  P(z  >  147)  =  1  -  .9292  =  .0708 


20  26.5 

H - 1 - 


0  1.47 


Una  productora  de  bebidas  gaseosas  estaba  completamente  segura  de  que  su  marca  tenia 
10%  de  participation  en  el  mercado.  En  un  estudio  de  mercado  que  comprendia  2500 
consumidores  de  bebidas  gaseosas,  x  =  2 1 1  expresaron  una  preferencia  por  la  marca  de 
ella.  Si  la  cifra  de  10%  es  correcta,  encuentre  la  probabilidad  de  observar  21 1  o  menos 
consumidores  que  prefieren  la  marca  de  bebidas  gaseosas  de  ella. 


Solucion  Si  la  productora  tiene  razon,  entonces  la  probabilidad  de  que  un  consumi- 
dor  prefiera  la  marca  de  bebidas  gaseosas  de  ella  es  p  =  .10.  Entonces 


p.  =  np  =  2500(40)  =  250 

er  =  \fnpq  =  V2500(.10)(.90)  =  15 

La  probabilidad  de  observar  21 1  o  menos  que  prefieran  la  marca  de  ella  es 


P(x  <211)  =  p( 0)  +  p(  1)  +  •  •  •  +  p(210)  +  p(211) 


La  aproximacion  normal  a  esta  probabilidad  es  el  area  a  la  izquierda  de  21 1.5  bajo  una 
curva  normal  con  una  media  de  250  y  una  desviacion  estandar  de  15.  Primero  calcu- 
lamos 


z  = 


211.5  -  250 
15 


-2.57 


Entonces 


P{x  <211)==  P(z  <  -2.57)  =  .0051 

La  probabilidad  de  observar  un  valor  de  muestra  de  21 1  o  menos  cuando  p  =  .10  es  tan 
pequena  que  se  puede  concluir  que  una  de  dos  cosas  ha  ocurrido:  o  se  ha  observado  una 
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muestra  poco  comun  aim  cuando  en  realidad  p  =  .10,  o  bien  la  muestra  refleja  que  el 
valor  real  de  p  es  menor  a  .10  y  quiza  mas  cercana  a  la  proporcion  muestral  observada, 


211/2500  =  .08. 


© 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  ref i ere  n  a  la  seccion  Mi  en  tree  ad  or  personal  de  la  pagina  240. 

6.35  Considere  una  variable  aleatoria  binomial  con  n  =  25  y  p  =  .6.  Llene  los  espacios  en 
bianco  que  siguen,  para  hallar  algunas  probabilidades  usando  la  aproximacion  normal. 

a.  (',Podcmos  usar  la  aproximacion  normal?  Calcule  np  = _ y  nq  = _ . 

b.  inp  y  nq  son  mayores  a  5?  Sf _  No _ 

c.  Si  la  respuesta  al  inciso  b)  es  si,  calcule  p  =  np  = _ y  cr  =  \Jnpq  = _ . 

d.  Para  hallar  la  probabilidad  de  mas  de  9  exitos,  ^que  valores  de  x  deben  ser  incluidos? 

x  = _ 

e.  Para  incluir  todo  el  bloque  de  probabilidad  para  el  primer  valor  de  x  = _ ,  empiece 

en _ . 

f.  Calcule  z  =  — np  = _ . 

\Jnpq 

g.  Calcule  P(x  >  9)  ~  P(z  < _ )  =  1  — _ = _ . 

6.36  Considere  una  variable  aleatoria  binomial  con  n  =  45  y  p  =  .05.  Llene  los  espacios 
en  bianco  que  siguen  para  hallar  algunas  probabilidades  usando  la  aproximacion  normal. 

a.  (',Podcmos  usar  la  aproximacion  normal?  Calcule  np  = _ y  nq  = _ . 

b.  isnp  y  nq  son  mayores  a  5?  Si _  No _ 

c.  Si  la  respuesta  al  inciso  b)  es  si,  calcule  p  =  np  = _ y  cr  =  \Jnpq  = _ . 

d.  Para  hallar  la  probabilidad  de  10  exitos  o  menos,  ^que  valores  de  x  deben  ser  incluidos? 

x  = _ 

e.  Para  incluir  todo  el  bloque  de  probabilidad  para  el  primer  valor  de  x  = _ ,  empiece 

en _ . 

r.  .  .  x±  .5  -  np 

f.  Calcule  z  = - ; - —  = _ ■ 

\Jnpq 

g.  Calcule  P(x  <  10)  ~  P(z  < _ )  = _ . 


TECNICAS  BASICAS 

6.37  Sea  x  la  variable  aleatoria  binomio  con  n  =  25  y 
P  =  -3. 

a.  (',La  aproximacion  normal  es  apropiada  para  esta 
variable  aleatoria  binomial? 

b.  Encuentre  la  media  y  desviacion  estandar  para  x. 

c.  Use  la  aproximacion  normal  para  hallar  P( 6  <  jc  <  9). 

d.  Use  la  tabla  1  del  apendice  I  para  hallar  la 
probabilidad  exacta  P(  6  <i<9).  Compare  los 
resultados  de  los  incisos  c)  y  d).  ^Que  tan  cercana  es 
la  aproximacion  hecha  por  usted? 


6.38  Sea  x  la  variable  aleatoria  binomial  con  n  =  15  y 
p  =  .5. 

a.  (:,La  aproximacion  normal  es  apropiada? 

b.  Encuentre  P( x  >  6)  usando  la  aproximacion  normal. 

c.  Encuentre  P(x  >  6)  usando  la  aproximacion  normal. 

d.  Encuentre  las  probabilidades  exactas  de  los  incisos  b) 
y  c),  y  compare  usted  estas  con  sus  aproximaciones. 

6.39  Sea  x  la  variable  aleatoria  binomial  con  n  =  100 
y  p  =  .2.  Encuentre  aproximaciones  a  estas 
probabilidades: 
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а.  P(x  >  22)  b.  P(x  >  22) 

c.  P{ 20  <  x  <  25)  d.  P(x  <  25) 

б. 40  Sea  x  la  variable  aleatoria  binomial  con  n  =  25  y 

p  =  .2. 

a.  Use  la  tabla  1  del  apendice  I  para  calcular  P( 4  <  x 

—  6). 

b.  Encuentre  p  y  cr  para  la  distribucion  binomial  de 
probabilidad  y  use  la  distribucion  normal  para 
aproximar  la  probabilidad  P( 4  <  i  <  6).  Observe  que 
este  valor  es  una  buena  aproximacion  al  valor  exacto 
de  P(4  <  x  <  6)  aun  cuando  np  =  5. 

6.41  Suponga  que  una  variable  aleatoria  x  tiene  una 
distribucion  binomial  correspondiente  a  n  =  20  y 

p  =  .30.  Use  la  tabla  1  del  apendice  I  para  calcular  estas 
probabilidades: 

a.  P(x  =  5)  b.  P(x  >  7) 

6.42  Consulte  el  ejercicio  6.41.  Use  la  aproximacion 
normal  para  calcular  P(x  =  5)  y  P(x  >  7).  Compare 
con  los  valores  exactos  obtenidos  de  la  tabla  1  del 
apendice  I. 

6.43  Considere  un  experimento  binomial  con  n  =  20 
y  p  =  .4.  Calcule  P(x  >10)  usando  cada  uno  de  estos 
metodos: 

a.  Tabla  1  del  apendice  I. 

b.  La  aproximacion  normal  a  la  distribucion  binomial  de 
probabilidad. 

6.44  Encuentre  la  aproximacion  normal  a  P( 355  <  x 
<  360)  para  una  distribucion  binomial  de  probabilidad 
con  n  =  400  y  p  =  .9. 

APLICACIONES 

6.45  Cine  en  casa  ^Con  que  frecuencia  ve  usted 
cine  en  casa?  Un  articulo  de  USA  Today  encontro  que 
alrededor  de  7  de  cada  10  adultos  dicen  que  ven  cine  en 
casa  al  menos  una  vez  a  la  semana.5  Suponga  que  una 


muestra  aleatoria  de  n  =  50  adultos  son  encuestados  y  se 
les  pregunta  si  vieron  una  pelfcula  en  casa  esta  semana. 
Supongamos  que  p  =  . 7  es,  de  hecho,  correcto.  ^Cuales 
son  las  probabilidades  para  los  siguientes  eventos? 

a.  ^Menos  de  30  personas  vieron  una  pelfcula  en  casa 
esta  semana? 

b.  <\Mas  de  42  personas  vieron  una  pelfcula  en  casa  esta 
semana? 

c.  <',Menos  de  10  personas  no  vieron  una  pelfcula  en  casa 
esta  semana? 

6.46  Defectos  geneticos  Datos  recolectados  en  un 
largo  periodo  demuestran  que  se  presenta  un  defecto 
genetico  particular  en  1  de  cada  1000  ninos.  Los  registros 
de  una  clfnica  medica  presentan  x  =  60  ninos  con 

el  defecto  en  un  total  de  50  mil  examinados.  Si  los 
50  mil  ninos  fueran  una  muestra  aleatoria  de  la  poblacion 
de  ninos  representada  por  registros  del  pasado,  ^cual  es  la 
probabilidad  de  observar  un  valor  de  x  igual  a  60  o  mas? 
(\Dina  usted  que  la  observation  de  x  =  60  ninos  con 
defectos  geneticos  representa  un  evento  raro? 

6.47  Nlo  presentada  Es  frecuente  que  lfneas  aereas  y 
hoteles  concedan  reservaciones  que  rebasan  la  capacidad, 
para  reducir  al  mfnimo  las  perdidas  debidas  a  las  que 

no  se  concretan.  Suponga  que  los  registros  de  un  hotel 
indican  que,  en  promedio,  10%  de  sus  prospectos  de 
pasajeros  no  reclaman  su  reservation.  Si  el  hotel  acepta 
215  reservaciones  y  hay  solo  200  cuartos  en  el  hotel, 

(■cual  es  la  probabilidad  de  que  todos  los  pasajeros  que 
lleguen  a  pedir  un  cuarto  lo  reciban? 

6.48  Cancer  de  pulmones  La  compilation  de 
grandes  masas  de  datos  sobre  cancer  de  pulmones 
muestra  que  alrededor  de  1  de  cada  40  adultos  adquiere 
la  enfermedad.  Se  sabe  que  los  trabajadores  de  cierta 
ocupacion  trabajan  en  ambiente  de  aire  contaminado  que 
puede  causar  un  mayor  porcentaje  de  cancer  de  pulmon. 
Una  muestra  aleatoria  de  n  =  400  trabajadores  muestra 
19  con  casos  identificables  de  cancer  de  pulmon.  6Estos 
datos  dan  suficiente  evidencia  para  indicar  un 
porcentaje  mas  alto  de  cancer  de  pulmon  para  estos 
trabajadores  que  para  el  promedio  nacional? 

6.49  l Altos  o  bajos?  ^Un  presidente  alto  es  mejor 
que  uno  de  baja  estatura?  ^Los  estadounidenses  tienden 
a  votar  por  el  mas  alto  de  los  dos  candidatos  en  una 
seleccion  presidencial?  En  33  de  nuestras  elecciones 
presidenciales  entre  1856  y  2006,  17  de  los  ganadores 
eran  mas  altos  que  sus  oponentes.1  Suponga  que  los 
estadounidenses  no  estan  sesgados  por  la  estatura  de  un 
candidato  y  que  el  ganador  tiene  igual  probabilidad  de 
ser  mas  alto  o  mas  bajo  en  estatura  que  su  oponente.  Lis 
poco  comun  el  numero  observado  de  ganadores  mas  altos 
en  las  elecciones  presidenciales  de  Estados  Unidos? 
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a.  Encuentre  la  probabilidad  aproximada  de  hallar  17  o 
mas  de  los  33  pares  en  los  que  gana  el  candidato  mas 
alto. 

b.  Con  base  en  su  respuesta  al  inciso  a),  ^puede  usted 
concluir  que  los  estadounidenses  podrfan  considerar  la 
estatura  de  un  candidato  cuando  depositen  su  voto? 

6.50  il  factor  Rh  En  cierta  poblacion,  15%  de  las 
personas  tienen  tipo  de  sangre  Rh  negativo.  Un  banco 
de  sangre  que  da  servicio  a  esta  poblacion  recibe  92 
donadores  en  un  dia  particular. 

a.  ('Cual  es  la  probabilidad  de  que  10  o  menos  tengan  Rh 
negativo? 

b.  ('Cual  es  la  probabilidad  de  que  15  o  20  (inclusive)  de 
los  donadores  tengan  Rh  negativo? 

c.  ('Cual  es  la  probabilidad  de  que  mas  de  80  de  los 
donadores  tengan  Rh  negativo? 

6.51  Participacion  de  Pepsi  en  el  mercado  Dos  de 

los  principales  rivales  en  bebidas  gaseosas,  Pepsi  y  Coca- 
Cola,  estan  muy  preocupados  de  su  participacion  en  el 
mercado.  La  siguiente  grafica  de  pastel,  que  aparecio  en 
el  sitio  web  de  la  compafua  (http://www.pepsico.com) 
en  noviembre  de  2006,  dice  que  la  participacion  de  Pepsi¬ 
Cola  en  el  mercado  estadounidense  de  refrescos  es  26%.s 
Suponga  que  esta  proporcion  es  cercanci  a  la  probabilidad 
de  que  una  persona  seleccionada  al  azar  indica  una 
preferencia  por  un  producto  Pepsi  cuando  escoge 
una  gaseosa. 


Participacion  en  el  mercado 
de  refrescos  liquidos 
en  Estados  Unidos 

%  de  volumen  en  canales  medidos 


/  Marca\  Otros  \ 
/  privada\  20%  .A 
^\J4%  \ 

Coca-Cola  /K  PepsiCo 
24%  /  \\  26% 


Cadbury  Nestle 

Schweppes  6% 

10% 

PepsiCo  tiene  la  mayor  parte 
del  mercado  de  refrescos  liquidos 


Se  selecciona  al  azar  un  grupo  de  prueba  de  500 
consumidores.  Use  la  curva  normal  para  aproximar  las 
siguientes  probabilidades  binomiales: 


a.  Exactamente  150  consumidores  prefieren  un  producto 
Pepsi. 

b.  Entre  120  y  150  consumidores  (inclusive)  prefieren  un 
producto  Pepsi. 

c.  Menos  de  150  consumidores  prefieren  un  producto 
Pepsi. 

d.  (ySei'fa  poco  comun  hallar  que  232  de  los  500 
consumidores  prefieran  un  producto  Pepsi?  Si  esto 
ocurriera,  (',que  conclusiones  sacaria  usted? 

6.52  Listos,  acomodense,  descansen  Una  familia 
tipica  estadounidense  pasa  mucho  tiempo  en  auto 

de  una  actividad  a  otra  y  tambien  en  filas  de  entrada 
a  restaurantes  de  comida  rapida.  Hay  una  evidencia 
cada  vez  mayor  que  sugiere  que  estamos  empezando 
a  agotarnos.  De  hecho,  en  un  estudio  realizado  para  el 
Centro  para  un  Nuevo  Sueno  Americano,  la  revista  Time 
informa  que  60%  de  los  estadounidenses  sienten  presion 
por  trabajar  demasiado  y  80%  desean  tener  mas  tiempo 
en  familia.7  Suponga  que  estos  porcentajes  son  correctos 
para  todos  los  estadounidenses  y  que  se  selecciona  una 
muestra  aleatoria  de  25  de  ellos. 

a.  Use  la  tabla  1  del  apendice  I  para  hallar  la 
probabilidad  de  que  mas  de  20  sientan  presion  por 
trabajar  demasiado. 

b.  Use  la  aproximacion  normal  a  la  distribucion  binomial 
para  aproximar  la  probabilidad  del  inciso  a).  Compare 
sus  respuestas  con  el  valor  exacto  del  inciso  a). 

c.  Use  la  tabla  1  del  apendice  I  para  hallar  la 
probabilidad  de  que  entre  15  y  20  (inclusive)  deseen 
estar  mas  tiempo  en  familia. 

d.  Use  la  aproximacion  normal  a  la  distribucion  binomial 
para  aproximar  la  probabilidad  del  inciso  c).  Compare 
su  respuesta  con  el  valor  exacto  del  inciso  c). 

6.53  Dijimos,  "descansen"  El  artfculo  de  la  revista 
Time1  (ejercicio  6.52)  tambien  informo  que  80%  de 
hombres  y  62%  de  mujeres  emplean  mas  de  40  horas  a 
la  semana  en  el  trabajo.  Suponga  que  estos  porcentajes 
son  correctos  para  todos  los  estadounidenses  y  que 

se  selecciona  una  muestra  aleatoria  de  50  mujeres 
trabajadoras. 

a.  yCual  es  el  numero  promedio  de  mujeres  que  emplean 
mas  de  40  horas  a  la  semana  en  el  trabajo? 

b.  (iCual  es  la  desviacion  estandar  para  el  numero  de 
mujeres  que  emplean  mas  de  40  horas  a  la  semana  en 
el  trabajo? 

c.  Suponga  que  en  nuestra  muestra  de  50  mujeres 
trabajadoras  hay  25  que  trabajan  mas  de  40  horas  a  la 
semana.  /Considera  usted  que  esto  es  un  suceso  poco 
comun?  Explique. 
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REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Distribuciones  continuas 
de  probabilidad 

1.  Variables  aleatorias  continuas. 

2.  Distribuciones  de  probabilidad  o  funciones 
de  densidad  de  probabilidad: 

a.  Las  curvas  son  lisas. 

b.  El  area  bajo  la  curva  es  igual  a  1. 

c.  El  area  bajo  la  curva  entre  ay  b  representa  la 
probabilidad  de  que  x  caiga  entre  ay  b. 

d.  P(x  =  a)  =  0  para  variables  aleatorias 
continuas. 

II.  La  distribucion  normal  de  probabilidad 

1 .  Es  simetrica  alrededor  de  su  media  /jl. 

2.  Forma  determinada  por  su  desviacion  estandar  cr. 


III.  La  distribucion  normal  estandar 

1.  La  variable  aleatoria  normal  estandar  z  tiene 
media  0  y  desviacion  estandar  1 . 

2.  Cualquier  variable  aleatoria  normal  x  puede  ser 
transformada  a  una  variable  aleatoria  normal 
estandar  usando 

x  —  /x 


3.  Convierta  valores  necesarios  de  x  a  z. 

4.  Use  la  tabla  3  del  apendice  1  para  calcular 
probabilidades  normales  estandar. 

4.  Varios  valores  z  importantes  tienen  areas  de  cola 
derecha  como  sigue: 


Area  de  cola  derecha 

.005 

.01 

.025 

.05 

.10 

Valor  z 

2.58 

2.33 

1.96 

1.645 

1.28 

Probabilidades  normales 


Cuando  la  variable  aleatoria  de  interes  tiene  una  distribucion  normal  de  probabilidad,  se 
pueden  generar  cualquiera  de  estas  probabilidades: 

•  Probabilidades  acumulativas,  P(x  <  k),  para  un  valor  dado  de  k 

•  Probabilidades  acumulativas  inversas,  el  valor  de  k  tal  que  el  area  a  su  izquierda 
bajo  la  distribucion  normal  de  probabilidad  es  igual  a  a 

Usted  debe  especificar  cual  distribucion  normal  esta  usando  y  los  parametros  necesarios: 
la  media  fx  y  la  desviacion  estandar  cr.  A1  igual  que  en  el  capitulo  5,  usted  tiene  la  opcion 
de  especificar  solo  un  valor  de  k  (o  de  a)  o  varios  valores  de  k  (o  de  a),  que  deben  guar- 
darse  en  una  columna  (por  ejemplo  en  Cl)  de  la  hoja  de  trabajo  MINITAB. 

Suponga  que  el  promedio  de  peso  de  bebes  al  nacer,  en  hospitales  propiedad  de  una 
importante  organization  de  mantenimiento  de  la  salud  (HMO),  es  aproximadamente  nor¬ 
mal  con  media  de  6.75  libras  y  desviacion  estandar  de  .54  libras.  ^Que  proportion  de 
bebes  nacidos  en  estos  hospitales  pesa  entre  6  y  7  libras?  Para  usar  MINITAB  para  hallar 
P( 6  <  x  <  7),  aplique  nombre  a  la  columna  Cl  como  “x”  e  introduzca  los  valores  crtti- 
cos  ;r  =  6y.r  =  7en  esta  columna.  Use  Calc  — »  Probability  Distributions  — »  Normal 
para  generar  el  cuadro  de  Dialogo,  como  se  muestra  en  la  figura  6.23. 

Teclee  los  valores  para  ya  y  cr  en  las  cajas  apropiadas  (los  valores  predeterminados 
generan  probabilidades  para  la  distribucion  normal  estandar  z),  y  seleccione  Cl  para  la 
columna  de  entrada.  (Si  no  teclea  un  numero  de  columna  para  guardado  opcional,  MINI- 
TAB  presentara  los  resultados  en  la  ventana  Session.)  Verifique  que  se  encuentre  selec- 
cionado  el  boton  de  radio  marcado  “Cumulative  probability”.  La  funcion  de  distribucion 
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FIGURA  6.23 
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FIGURA  6.24 

Cumulative  Distribution  Function 

Got  mi  vt  eh  bear.  •  6.7E  ar.d  a  e  and  aid  deviation  •  0.54 

x  ri  x  <•  x  ) 

«  0.082433 

7  0.(78303 


acumulativa  para  x  =  6  y  x  =  1  aparece  en  la  ventana  Session  cuando  el  usuario  haga 
clic  en  OK  (vease  la  figura  6.24).  Para  hallar  P(6  <x<l),  recuerde  que  la  probabilidad 
acumulativa  es  el  area  a  la  izquierda  del  valor  dado  de  x.  Por  tanto, 

P(6  <  x<l)  =  P(x  <  7)  -  P(x  <  6)  =  .678305  -  .082433  =  .595872 

Si  se  desea,  se  puede  verificar  este  calculo  usando  la  tabla  3  del  apendice  I. 

Para  calcular  probabilidades  acumulativas  inversas,  use  Calc  — >  Probability  Distri¬ 
butions  —>  Normal  otra  vez.  Asegurese  de  que  se  encuentra  seleccionado  el  boton  de 
radio  marcado  “Inverse  cumulative  probability”  y  que  la  media  y  desviacion  estandar 
estan  introducidas  en  las  cajas  apropiadas.  A  continuacion  introduzca  los  valores  apro- 
piados  de  a  en  Cl  o  bien,  si  tiene  un  solo  valor,  introduzca  el  valor  en  la  caja  constante 
de  Entrada.  Por  ejemplo,  para  hallar  el  95avo  percentil  del  peso  al  nacer,  se  busca  un 
valor  k  tal  que  solo  5%  de  los  valores  de  x  exceden  de  este  valor  (y  95%  son  mas  o  me- 
nos  iguales  a  k).  Si  usted  introduce  la  probabilidad  .95  en  la  caja  constante  de  Entrada 
y  selecciona  la  opcion  marcada  “Inverse  cumulative  probability”,  aparecera  el  95avo 
percentil  en  la  ventana  Session,  como  en  la  figura  6.25.  Esto  es,  95%  de  todos  los  bebes 
nacidos  en  estos  hospitales  pesan  7.63822  libras  o  menos.  ^Considerarfa  usted  que  un 
bebe  que  pesa  9  libras  es  anormalmente  grande? 
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FIGURA  6.25 


CE  Session 

MM  *1 

Inverse  Cumulative  Distribution  Function 

* 

Manat  with  bean  •  o.7i  and  standard  deviation  •  0.!>4 

P(  X  <•  v  )  v 

0.95  7.63022 

1 

V 

12. 

EJercicios  suplementarios 

6.54  Usando  la  tabla  3  del  apendice  I,  calcule  el 
area  bajo  la  curva  normal  estandar  a  la  izquierda  de  lo 
siguiente: 

a.  z  =  1.2  b.  z  =  -.9 

c.  z  =  1.46  d.  z  =  —.42 

6.55  Encuentre  las  siguientes  probabilidades  para  la 
variable  aleatoria  normal  estandar: 

a. P(.3  <z<  1.56)  b.  P{—.2  <  z  <  .2) 

6.56  a.  Encuentre  la  probabilidad  de  que  z  sea  mayor  a 
-.75. 

b.  Encuentre  la  probabilidad  de  que  z  sea  menor  a  1.35. 

6.57  Encuentre  Zo  tal  que  P(z  >  Zo)  =  .5. 

6.58  Encuentre  la  probabilidad  de  que  z,  se  encuentre 
entre  z  =  —  1 .48  y  z  =  1-48. 

6.59  Encuentre  Zo  tal  que  P(~Zo  <  z,  <  z,n)=  .5.  ^Cuales 
percentiles  representan  — z0  y  Zo? 

6.60  Barrenas  La  vida  util  de  las  barrenas  en  pozos 
petroleros  depende  de  los  tipos  de  roca  y  suelo  que 
encuentre  la  barrena,  pero  se  estima  que  la  duration 
media  es  de  75  horas.  Suponga  que  una  compama  de 
exploration  petrolera  compra  barrenas,  que  tienen  una 
vida  util  que  esta  distribuida  normalmente  en  forma 
aproximada,  con  una  media  igual  a  75  horas  y  una 
desviacion  estandar  igual  a  12  horas. 

a.  i,Que  proportion  de  barrenas  de  la  compafha  fallaran 
antes  de  60  horas  de  uso? 

b.  ^Que  proportion  durara  al  menos  60  horas? 

c.  ^Que  proportion  tendra  que  cambiarse  despues  de  mas 
de  90  horas  de  uso? 

6.61  Edades  de  profesorado  El  influjo  de  nuevos 
ideas  en  una  universidad,  introducidas  principalmente  por 


profesores  jovenes,  esta  convirtiendose  en  materia 
de  preocupacion  debido  a  las  edades  cada  vez  mayores  de 
miembros  de  la  facultad;  esto  es,  la  distribution  de 
edades  del  profesorado  esta  cambiando  hacia  arriba 
debido  principalmente  a  una  escasez  de  posiciones 
vacantes  y  exceso  de  oferta  de  doctorados.  Entonces, 
los  miembros  del  profesorado  estan  reacios  a  moverse 
y  abandonar  una  position  segura.  Si  la  edad  de  retiro  en 
casi  todas  las  universidades  es  de  65  anos,  /.esperarfa 
usted  que  la  distribution  de  edades  del  profesorado  sea 
normal?  Explique. 

6.62  Diametros  de  cojinetes  La  operation  de 
una  maquina  produce  cojinetes  cuyos  diametros  estan 
normalmente  distribuidos,  con  media  y  desviacion 
estandar  igual  a  .498  y  .002,  respectivamente. 

Si  las  especificaciones  requieren  que  el  diametro 
del  cojinete  sea  igual  a  .500  de  pulgada  ±  .004  de 
pulgada,  ('C|ue  fraction  de  la  production  serfa 
inaceptable? 

6.63  Autos  usados  Un  distribuidor  de  autos  usados 
ha  encontrado  que  el  tiempo  antes  de  que  se  requiera  una 
reparation  importante  en  los  autos  que  el  vende,  esta 
normalmente  distribuida  con  una  media  igual  a  10  meses 
y  una  desviacion  estandar  de  3  meses.  Si  el  distribuidor 
desea  que  solo  5%  de  los  autos  fallen  antes  que  termine 
el  periodo  de  garantfa,  ^por  cuantos  meses  deben  estar 
garantizados  los  autos? 

6.64  Ventas  en  restaurantes  El  total  de  las  ventas 
diarias  (excepto  sabados)  en  un  pequeno  restaurante  tiene 
una  distribution  de  probabilidad  que  es  aproximadamente 
normal,  con  una  media  /x  igual  a  $1230  por  dfa  y  una 
desviacion  estandar  cr  igual  a  $120. 

a.  ^Cual  es  la  probabilidad  de  que  las  ventas  excedan  de 
$1400  para  un  dfa  determinado? 
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b.  El  restaurante  debe  tener  al  menos  $1000  en  ventas 
por  dfa  para  salir  sin  perdidas  ni  ganancias.  (jCual 
es  la  probabilidad  de  que  en  un  dfa  determinado  el 
restaurante  no  saiga  sin  perdidas  ni  ganancias? 

6.65  Lavadoras  La  vida  util  de  un  tipo  de  lavadoras 
automaticas  esta  distribuida  normalmente  en  forma 
aproximada,  con  media  y  desviacion  estandar  igual  a  10.5 
y  3.0  anos,  respectivamente.  Si  este  tipo  de  lavadora  esta 
garantizada  durante  un  periodo  de  5  anos,  ('t|ue  fraction 
necesitara  ser  reparada  y/o  repuesta? 

6.66  Abridores  de  puertas  de  garaje  Casi  todos  los 
usuarios  de  abridores  de  puertas  de  garaje  activan  sus 
abridores  a  distancias  que  estan  normalmente  distribuidas, 
con  una  media  de  30  pies  y  una  desviacion  estandar  de 

1 1  pies.  Para  reducir  al  mfnirno  la  interferencia  con  otros 
aparatos  a  control  remoto,  se  especifica  al  fabricante  que 
limite  la  distancia  de  operacion  a  50  pies.  (,Que  porcentaje 
del  tiempo  trataran  los  usuarios  de  operar  el  abridor  fuera 
de  su  lfmite  de  operacion? 

6.67  ^Cuanto  dura  el  examen?  Se  ha  encontrado 
que  la  duration  promedio,  requerida  para  completar  un 
examen  de  conocimientos  en  una  universidad,  es  igual  a 
70  minutos  con  una  desviacion  estandar  de  12  minutos. 
/Cuando  debe  terminarse  el  examen  si  se  desea  permitir 
tiempo  suficiente  para  que  90%  de  los  estudiantes 

lo  completen?  (Suponga  que  el  tiempo  necesario  para 
completar  el  examen  esta  normalmente  distribuido.) 

6.68  Servicio  a  automoviles  El  lapso  necesario 
para  mantenimiento  periodico  de  un  automovil  tendra, 
por  lo  general,  una  distribucion  de  probabilidad  que  es 
de  forma  de  montfculo  y,  debido  a  que  ocurriran  largos 
tiempos  de  servicio,  esta  sesgado  a  la  derecha.  El  tiempo 
necesario  para  correr  una  prueba  de  5000  millas  y  dar 
servicio  a  un  automovil  tiene  una  media  igual  a  1 .4 
horas  y  una  desviacion  estandar  de  .7  horas.  Suponga 
que  el  departamento  de  servicio  planea  dar  servicio  a 

50  automoviles  por  dfa  de  8  horas  y  que,  para  hacerlo, 
no  debe  emplear  mas  de  un  promedio  de  1 .6  horas  por 
automovil.  ^Que  proportion  de  todos  los  dfas  tendra  que 
trabajar  tiempo  extra  el  departamento  de  servicio? 

6.69  Felevidentes  Una  agenda  de  publicidad  ha 
expresado  que  20%  de  todos  los  televidentes  ven  un 
programa  particular.  En  una  muestra  aleatoria  de  1000 
televidentes,  x  =  184  estaban  viendo  el  programa.  ^Estos 
datos  presentan  suficiente  evidencia  para  contradecir  lo 
dicho  por  el  anunciante? 

6.70  Pronostico  de  ganancias  Un  investigador 
observa  que  los  altos  ejecutivos  de  empresas  no  son 
pronosticadores  muy  precisos  de  sus  propias  ganancias 
anuales.  Dice  que  sus  estudios  de  un  gran  numero  de 
pronosticos  de  ejecutivos  de  companfas  “mostraron  que 
la  estimation  promedio  erraron  la  marca  en  15%”. 


a.  Suponga  que  la  distribucion  de  estos  errores  de 
pronostico  tiene  una  media  de  15%  y  desviacion 
estandar  de  10%.  <',Es  probable  que  la  distribucion  de 
errores  de  pronostico  sea  aproximadamente  normal? 

b.  Suponga  que  la  probabilidad  es  .5  que  un  error  de 
pronostico  de  un  ejecutivo  corporativo  exceda  de  15%. 
Si  usted  fuera  a  muestrear  los  pronosticos  de  100 
ejecutivos  corporativos,  <;cual  es  la  probabilidad  de 
que  mas  de  60  estarfan  errados  en  mas  de  15%? 

6.71  Llenar  vasos  de  refresco  Una  maquina  que 
envasa  refrescos  puede  ser  regulada  para  descargar  un 
promedio  de  /jl  onzas  por  vaso.  Si  las  onzas  de  lfquido 
estan  normalmente  distribuidas,  con  desviacion  estandar 
igual  a  .3  de  onza,  de  el  ajuste  para  /x  de  modo  que  vasos 
de  8  onzas  (‘A  de  litro)  se  rebosen  solo  1%  del  tiempo. 

6.72  Bombillas  electricas  Una  planta  fabricante 
utiliza  3000  bombillas  electricas  cuyas  duraciones  estan 
normalmente  distribuidas,  con  media  y  desviacion 
estandar  igual  a  500  y  50  horas,  respectivamente.  Para 
reducir  al  mfnimo  el  numero  de  bombillas  que  se  queman 
durante  las  horas  de  operacion,  todas  las  bombillas 

se  cambian  despues  de  un  periodo  determinado  de 
operacion.  (jCon  que  frecuencia  deben  cambiarse  las 
bombillas  si  deseamos  que  no  mas  de  1%  de  ellas  se 
quemen  entre  periodos  de  cambio? 

6.73  El  grupo  de  primer  ano  La  oficina  de 
inscripciones  de  una  pequena  universidad  recibe 
solicitudes  de  que  acepte  depositos  de  varios  prospectos 
de  estudiantes  de  primer  ano  calihcados,  de  modo  que, 
con  probabilidad  de  alrededor  de  .95,  el  tamano  del  grupo 
de  primer  ano  sera  menor  o  igual  a  120.  Suponga  que 

los  solicitantes  constituyen  una  muestra  aleatoria  de  una 
poblacion  de  solicitantes,  80%  de  los  cuales  en  realidad 
entran  al  grupo  de  primer  ano  si  son  aceptados. 

a.  ^Cuantos  depositos  debe  aceptar  el  asesor  legal  de 
inscripciones? 

b.  Si  los  solicitantes  en  el  numero  determinado  en  el 
inciso  a)  son  aceptados,  ^cual  es  la  probabilidad 

de  que  el  tamano  del  grupo  de  primer  ano  sea  menor 
a  105? 

6.74  No  presentadas  Una  lfnea  aerea  encuentra  que 
5%  de  las  personas  que  hacen  reservaciones  en  cierto  vuelo 
no  se  presentan  para  el  vuelo.  Si  la  aerolfnea  vende  160 
boletos  para  un  vuelo  que  tiene  solo  155  asientos,  (:,cual  es 
la  probabilidad  de  que  un  asiento  este  disponible  para  toda 
persona  que  tenga  una  reservation  y  planee  volar? 

6.75  Larga  distancia  Se  sabe  que  30%  de  todas 
las  llamadas  que  entran  a  un  conmutador  son  de  larga 
distancia.  Si  200  llamadas  entran  al  conmutador,  -  ciial 
es  la  probabilidad  de  que  al  menos  50  sean  de  larga 
distancia? 
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6.76  Genetica  en  plantas  En  el  ejercicio  5.75, 
una  cruza  entre  dos  plantas,  una  de  ellas  con  petalos 
rojos  y  una  con  petalos  veteados,  produjeron  plantas 
descendientes  con  petalos  rojos  75%  de  las  veces. 
Suponga  que  100  semillas  de  esta  cruza  se  recolectaron  y 
terminaron,  y  x,  el  numero  de  plantas  con  petalos  rojos, 
se  registro. 

a.  ('Cual  es  la  distribucion  de  probabilidad  para  x? 

b.  (iEs  apropiado  aproximar  la  distribucion  del  inciso  a) 
usando  la  distribucion  normal?  Explique. 

c.  Use  un  metodo  apropiado  para  hallar  la  probabilidad 
aproximada  de  que  entre  70  y  80  (inclusive)  plantas 
descendientes  tengan  flores  rojas. 

d.  ('Cual  es  la  probabilidad  de  que  53  o  menos  de  plantas 
descendientes  tengan  flores  rojas?  (:,Es  este  un  suceso 
poco  comun? 

e.  Si  en  realidad  se  observaron  53  de  100  plantas 
descendientes  con  flores  rojas  y  si  estabamos  seguros 
que  la  proportion  genetica  3:1  era  correcta,  ^que  otra 
explication  podrfa  darse  para  este  suceso  poco  comun? 

6.77  Proveedores  A  o  B  Un  comprador  de 
relevadores  electricos  hace  compras  a  dos  proveedores, 

A  y  B.  El  proveedor  A  suministra  dos  de  cada 

tres  relevadores  empleados  por  la  companfa.  Si  75 
relevadores  de  los  empleados  por  la  companfa  se 
seleccionan  al  azar,  encuentre  la  probabilidad  de  que  a 
lo  sumo  48  de  esos  relevadores  provengan  del  proveedor 
A.  Suponga  que  la  companfa  utiliza  un  gran  numero  de 
relevadores. 

6.78  Bocadillos  y  T  ^La  television  es  riesgosa  para 
la  dieta  de  usted?  Los  psicologos  creen  que  comer  en 
exceso  puede  estar  asociado  con  estados  emocionales 
(estar  molesto  o  aburrido)  e  indicios  ambientales  (ver 
television,  leer,  etcetera).  Para  probar  esta  teorfa, 
suponga  que  se  han  seleccionado  al  azar  60  personas 
con  sobrepeso  y  pareadas  en  peso  y  genero.  Durante  2 
semanas,  se  pidio  a  uno  de  cada  pareja  que  pasara  las 
tardes  leyendo  novelas  de  interes  para  el  o  ella.  El  otro 
miembro  de  la  pareja  pasa  las  tardes  viendo  television.  La 
cantidad  de  calorfas  de  todos  los  bocadillos  y  refrescos 
consumidos  por  las  tardes  se  registro  por  cada  persona, 
siendo  x  =  19  el  numero  de  parejas  para  las  cuales  la 
ingesta  de  calorfas  de  los  televidentes  fue  mayor  que 

la  de  los  lectores.  Si  no  hay  diferencia  en  los  efectos  de 
television  y  lectura  en  ingesta  de  calorfas,  la  probabilidad 
p  de  que  la  ingesta  de  calorfas  de  un  miembro  de  cada 
pareja  exceda  la  del  otro  miembro  es  .5.  ^Estos  datos 
dan  suficiente  evidencia  para  indicar  una  diferencia  entre 
los  efectos  de  ver  television  y  leer  en  cuanto  a  ingesta 
de  calorfas  se  refiere?  (sugerencia:  Calcule  el  puntaje  z 
para  el  valor  observado,  x  =  19.) 


6.79  Tiempos  de  gestacion  The  Biology  Data  Book 
informa  que  el  tiempo  de  gestacion  para  humanos  bebes 
promedia  278  dfas,  con  una  desviacion  estandar  de  12 
dfas.8  Suponga  que  estos  tiempos  de  gestacion  estan 
normalmente  distribuidos. 

a.  Encuentre  los  cuartiles  superior  e  inferior  para  los 
tiempos  de  gestacion. 

b.  ^  Serf  a  poco  comun  tener  un  bebe  despues  de  solo  6 
meses  de  gestacion?  Explique. 

6.80  Auditorias  de  impuestos  En  el  ejercicio 
6.28,  sugerimos  que  el  IRS  (Hacienda)  asigna  tasas  de 
auditorfa  por  estado,  al  seleccionar  al  azar  50  porcentajes 
de  auditorfa  de  una  distribucion  normal  con  una  media 
igual  a  1.55%  y  desviacion  estandar  de  .45%. 

a.  (,CuaI  es  la  probabilidad  de  que  un  estado  particular  se 
audite  mas  de  2%  de  sus  devoluciones  de  impuesto  al 
ingreso? 

b.  yCiial  es  el  valor  esperado  de  x,  el  numero  de  estados 
a  los  que  se  auditara  mas  de  2%  de  sus  devoluciones 
de  impuesto  al  ingreso? 

c.  (',Es  probable  que  hasta  15  de  los  50  estados  se  les  audite 
mas  de  2%  de  sus  devoluciones  de  impuesto  al  ingreso? 

6.81  Su  deporte  favorito  Hay  diferencia  en 
preferencias  de  deportes  entre  hombres  y  mujeres, 
segun  una  encuesta  reciente.  Entre  los  10  deportes  mas 
populares,  los  hombres  incluyen  deportes  del  tipo  de 
competencia  por  ejemplo  billar  y  carambola,  baloncesto 
y  softbol,  mientras  que  las  mujeres  incluyen  aerobics, 
correr,  excursiones  y  calistenia.  No  obstante,  la  principal 
actividad  recreativa  para  hombres  era  todavfa  el  relajante 
deporte  de  la  pesca,  con  41%  de  los  encuestados  diciendo 
que  habfan  pescado  durante  el  ano.  Suponga  que  a  1 80 
hombres  seleccionados  al  azar  se  les  pregunto  si  habfan 
pescado  el  ano  pasado. 

a.  yCual  es  la  probabilidad  de  que  menos  de  50  hayan 
pescado? 

b.  yCual  es  la  probabilidad  de  que  entre  50  y  75  hayan 
pescado? 

c.  Si  los  180  hombres  seleccionados  para  la  entrevista 
fueran  seleccionados  por  el  departamento  de 
marketing  de  una  companfa  de  artfculos  deportivos, 
con  base  en  information  obtenida  de  sus  listas 

de  correos,  (',que  concluirfa  usted  acerca  de  la 
confiabilidad  de  los  resultados  de  su  encuesta? 

6.82  £lntrovertido  o  extrovertido?  Un  examen 
psicologico  para  introvertidos-extrovertidos  produjo 
calificaciones  que  tenfan  una  distribucion  normal  con  una 
media  y  desviacion  estandar  de  75  y  12,  respectivamente. 
Si  deseamos  designar  el  mas  alto  15%  a  extrovertidos, 
(:,cual  serfa  la  calificacion  apropiada  para  escoger  como  el 
punto  de  corte? 
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6.83  Doblar  las  calificaciones  Es  frecuente  que 
los  estudiantes  pregunten  a  sus  profesores  si  estaran 
“doblando  las  calificaciones”.  La  interpretacion 
tradicional  de  “doblar  calificaciones”  requerfa  que  las 
calificaciones  tuvieran  una  distribucion  normal  y  que 
las  calificaciones  se  asignaran  en  estas  proporciones: 


Letra  de  calificacion 

A 

B 

C 

D 

F 

Proporcion  de  estudiantes 

10% 

20% 

40% 

20% 

10% 

a.  Si  la  calificacion  promedio  “C”  esta  centrada  como 
la  calificacion  promedio  de  todos  los  estudiantes  y  si 
suponemos  que  las  calificaciones  estan  normalmente 
distribuidas,  ^cuantas  desviaciones  estandar  a  cada 
lado  de  la  media  constituiran  las  calificaciones  “C”? 

b.  ('  Cluantas  desviaciones  a  cada  lado  de  la  media  seran 
los  puntos  de  corte  para  las  calificaciones  “B”  y  “D”? 

6.84  Doblar  las  calificaciones,  continua  Consulte 
el  ejercicio  6.83.  Para  facilidad  de  calculo,  redondee  el 
numero  de  desviaciones  estandar  para  calificaciones 


“C”  a  ±.5  desviaciones  estandar  y  para  calificaciones 
“B”  y  “D”  a  ±1.5  desviaciones  estandar.  Suponga  que  la 
distribucion  de  calificaciones  para  un  grupo  grande 
de  estudiantes  tiene  un  promedio  de  78  con 
una  desviacion  estandar  de  1 1 .  Encuentre  los  puntos  de 
corte  apropiados  para  las  calificaciones  A,  B,  C,  D  y  F. 

6.85  Temperaturas  normales  En  el  ejercicio 
1.67,  Allen  Shoemaker  dedujo  una  distribucion  de 
temperaturas  del  cuerpo  humano,  que  tiene  una  forma 
de  montfculo  distintiva.9  Suponga  que  asumimos  que  las 
temperaturas  de  personas  sanas  son  aproximadamente 
normales,  con  una  media  de  98.6  grados  y  una  desviacion 
estandar  de  0.8  grados. 

a.  Si  se  selecciona  al  azar  una  persona  sana,  <;cual  es  la 
probabilidad  de  que  la  persona  tenga  una  temperatura 
arriba  de  99.0°? 

b.  (:,CuaI  es  el  95avo  percentil  para  las  temperaturas 
corporales  de  personas  sanas? 


APPLET 


Use  uno  de  los  tres  applets  (Normal  Distribution 
Probabilities,  Normal  Probabilities  and  z-Scores,  o 
Normal  Approximation  to  Binomial  Probabilities) 

descritos  en  este  capitulo,  para  resolver  los  siguientes 
ejercicios. 

6.86  Calcule  el  area  bajo  la  curva  normal  estandar  a  la 
izquierda  de  estos  valores: 

a.  z  =  —  .90  b.  z  =  2.34  c .  z  =  5.4 

6  87  Calcule  el  area  bajo  la  curva  normal  estandar  entre 
estos  valores: 

а.  z  =  — 2.0  y  z  =  2.0  b.  z  =  — 2.3  y  —  1.  5 

б. 88  Encuentre  las  siguientes  probabilidades  para  la 
variable  z  aleatoria  normal  estandar: 

a.  P(-1.96<z<  1.96)  b.  P(z>1.96) 

c.  P(z  <  —1.96) 

6.89  a.  Encuentre  una  z0  tal  que  P(z  >  Zo)=  .9750. 

b.  Encuentre  una  zo  tal  que  P(— z0  >  z0)  =  .3594. 

6.90  a.  Encuentre  una  z0  tal  que  P(— z0  Zo)  =  -95. 
b.  Encuentre  una  z0  tal  que  P(~Zo  —  Z  —  Zo)  =  -98. 

6.91  Una  variable  aleatoria  normal  x  tiene  media  de 

q.  =  5  y  cr  =  2.  Encuentre  las  siguientes  probabilidades 
de  estos  valores  x: 

a.  1.2  <  x  <  10  b.  x  >  7.5  c.  x  <  0 


6.92  Sea  x  una  variable  aleatoria  binomial  con  n  =  36  y 
p  =  .54.  Use  la  aproximacion  normal  para  hallar: 

a.  P(x<25)  b.  P(15<x<20) 

c.  P(x  >30) 

6.93  Etiqueta  de  telefono  celular  Un  artfculo  en 
USA  Today  indica  que  51%  de  los  estadounidenses  dicen 
que  la  persona  promedio  no  es  muy  considerada  hacia 
otros  cuando  habla  por  un  telefono  celular.10  Suponga  que 
se  seleccionan  al  azar  100  estadounidenses. 


a.  Use  el  applet  Calculating  Binomial  Probabilities  del 

capitulo  5  para  hallar  la  probabilidad  exacta  de  que 
60  o  mas  estadounidenses  indicarfan  que  la  persona 
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promedio  no  es  muy  considerada  hacia  otros  cuando 
habla  por  telefono  celular. 

b.  Use  el  Normal  Approximation  to  Binomial 
Probabilities  para  aproximar  la  probabilidad  del 
inciso  a).  Compare  sus  respuestas. 

6.94  Estampillas  Los  filatelistas  (coleccionistas 
de  estampillas)  con  frecuencia  ofrecen  estampillas  a 
precios  de  menudeo  o  cercanos  a  estos,  pero,  cuando 
venden,  el  precio  es  considerablemente  mas  bajo.  Por 
ejemplo,  puede  ser  razonable  suponer  que  (dependiendo 
de  la  mezcla  de  una  coleccion,  condicion,  demanda, 
condiciones  economicas,  etc.)  una  coleccion  se  vendera 
a  x%  del  precio  de  menudeo,  donde  x  esta  normalmente 
distribuida  con  una  media  igual  a  45%  y  una  desviacion 
estandar  de  4.5%.  Si  un  filatelista  tiene  una  coleccion 
para  venderla,  que  tiene  un  valor  al  menudeo  de  $30  mil, 
('  cual  es  la  probabilidad  de  que  el  filatelista  reciba  estas 
cantidades  por  la  coleccion? 

a.  Mas  de  $15  000  b.  Menos  de  $15  000 

c.  Menos  de  $12000 

6.95  Calificaciones  de  examen  Las  calificaciones  en 
un  examen  de  conocimientos  a  nivel  nacional  estuvieron 
distribuidas  normalmente  en  forma  aproximada,  con  una 
media  de  540  y  una  desviacion  estandar  de  110. 

a.  Si  usted  recibio  una  calificacion  de  680,  (',hasta  que 
punto,  en  desviaciones  estandar,  su  calificacion  se 
aparto  de  la  media? 


b.  (:,Quc  porcentaje  de  quienes  tomaron  el  examen 
obtuvieron  una  calificacion  mas  alta  que  usted? 

6.96  Salarios  del  profesorado  Aun  cuando  los 
salarios  del  profesorado  en  colegios  y  universidades  en 
Estados  Unidos  continua  a  la  alza,  no  siempre  siguen 
el  paso  con  el  costo  de  la  vida  ni  con  salarios  del  sector 
privado.  En  2005,  el  National  Center  for  Educational 
Services  indico  que  el  salario  promedio  para  profesores 
auxiliares  en  colegios  publicos  de  cuatro  anos  era  de 
$50581. 11  Suponga  que  estos  salarios  estan  normalmente 
distribuidos  con  una  desviacion  estandar  de  $4000. 

a.  (,Que  proporcion  de  profesores  auxiliares  en  colegios 
publicos  de  cuatro  anos  tendra  salarios  menores  a 
$45000? 

b.  (iQuc  proporcion  de  estos  profesores  tendra  salarios 
entre  $45  000  y  $55  000? 

6.97  Trasplante  de  celulas  Briggs  y  King  inventaron 
la  tecnica  de  trasplante  nuclear,  en  el  que  el  nucleo  de 
una  celula  de  una  de  las  etapas  finales  del  desarrollo 

de  un  embrion  es  trasplantado  en  un  cigoto  (un  huevo 
fertilizado  de  una  sola  celula)  para  ver  si  el  nucleo  puede 
soportar  un  desarrollo  normal.  Si  la  probabilidad  de  que 
un  solo  trasplante  de  la  primera  etapa  de  gastrula  sea 
exitoso  es  .65,  /cual  es  la  probabilidad  de  que  mas  de  70 
trasplantes  de  entre  100  sean  exitosos? 


CASO 

prActico 


La  larga  y  la  corta 


Si  usted  fuera  el  jefe,  ^la  estatura  desempenarfa  un  papel  en  la  seleccion  que  haga  de  un 
sucesor  para  el  trabajo  de  usted?  En  su  columna  Fortune ,  Daniel  Seligman  expuso  sus 
ideas  respecto  a  la  estatura  como  factor  en  la  seleccion  que  hizo  Deng  Xiaoping  en  Hu 
Yaobang  como  su  sucesor  para  presidente  del  Partido  Comunista  Chino.12  Como  lo  dice 
Seligman,  los  hechos  que  rodean  el  caso  levantaron  sospechas  cuando  fueron  examinados 
a  la  luz  de  unas  estadfsticas. 

Deng,  parece  ser,  media  solo  1.50  metros,  lo  cual  es  muy  poco  incluso  en  China.  Por 
tanto,  la  seleccion  de  Hu  Yaobang,  que  tambien  media  1.50  metros,  levanto  (o  bajo) 
algunas  cejas  porque,  como  dice  Seligman,  “las  probabilidades  contra  una  decision  de 
estatura  ciega  que  produjera  un  presidente  de  tan  poca  estatura  como  Deng  son  alrededor 
de  40  a  1”.  En  otras  palabras,  si  tuvieramos  la  distribucion  de  frecuencia  relativa  de  las  es- 
taturas  de  todos  los  chinos,  solo  1  en  41  (es  decir,  2.4%)  medirfa  1 .50  metros  o  menos.  Para 
calcular  estas  probabilidades,  Seligman  observa  que  el  equivalente  chino  del  U.S.  Health 
Service  no  existe  y  por  tanto  que  las  estadfsticas  de  salud  en  la  poblacion  actual  de  China 
son  diffciles  de  ver.  El  dice,  no  obstante,  que  “se  piensa  en  general  que  la  longitud  de 
un  nino  al  nacer  representa  28.6%  de  su  estatura  final”  y  que,  en  la  China  antes  de  la 
revolucion,  la  longitud  promedio  de  un  nino  chino  al  nacer  era  de  18.9  pulgadas.  De  esto, 
Seligman  deduce  que  la  estatura  media  de  hombres  chinos  adultos  es 


18.9 

.286 


66.08  pulgadas,  o  sea  5  pies  6.08  pulgadas 
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Entonces  el  supone  que  la  distribucion  de  las  estaturas  de  hombres  en  China  sigue  una 
distribucion  normal  (“como  en  Estados  Unidos”  con  una  media  de  66  pulgadas  y  una  des- 
viacion  estandar  igual  a  2.7  pulgadas,  “cifra  que  se  ve  bien  para  esa  media”. 

1 .  Usando  las  suposiciones  de  Seligman,  calcule  la  probabilidad  de  que  un  adulto  chino, 
escogido  al  azar,  tenga  una  estatura  menor  o  igual  a  5  pies,  o  lo  que  es  equivalente,  60 
pulgadas  de  estatura. 

2.  ('.Los  resultados  del  punto  1  concuerdan  con  las  probabilidades  de  Seligman? 

3.  Comente  sobre  la  validez  de  las  suposiciones  de  Seligman.  ^Hay  algunas  fallas  basi- 
cas  en  su  razonamiento? 

4.  Con  base  en  los  resultados  de  los  puntos  1  y  3,  6piensa  usted  que  Deng  Xiaoping  tomo 
en  cuenta  la  estatura  para  seleccionar  a  su  sucesor? 
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OBJETIVOS  GENERALES _ _ 

En  los  ultimos  capftulos,  estudiamos  poblaciones  y  los 
parametros  que  las  describen.  Estas  poblaciones  eran 
discretas  o  continuas  y  empleamos  la  probabilidad  como 
herramienta  para  determinar  que  tan  probables  podrian 
ser  ciertos  resultados  muestrales.  En  este  capitulo, 
nuestro  interes  cambia  cuando  empezamos  a  estudiar 
muestras  y  las  estadisticas  que  las  describen.  Estas  esta¬ 
disticas  muestrales  se  usan  para  hacer  inferencias  acerca 
de  los  correspondientes  parametros  de  poblacion.  Este 
capitulo  comprende  muestreo  y  distribuciones  muestra¬ 
les,  que  describen  el  comportamiento  de  estadisticas 
muestrales  en  muestreo  repetido. 


IN  DICE  DEL  CAPITULO _ 

El  teorema  del  limite  central  (7.4) 

Muestras  aleatorias  (7.2) 

La  distribucion  muestral  de  la  media  muestral, 
x  (7.5) 

La  distribucion  muestral  de  la  proporcion  muestral, 
p  (7.6) 

Planes  muestrales  y  disenos  experimentales  (7.2) 
Control  de  un  proceso  estadistico:  graficas  xy  p  (7.7) 
Estadisticas  y  distribuciones  muestrales  (7.3) 


ENTRENADOR  PERSONAL 


^Corno  calculo  probabilidades  para 
muestral  x? 

iComo  calculo  probabilidades  para 
muestral  p? 


la  media 
la  proporcion 


■)  Muestreo  de  la  Ruleta 
de  Monte  Carlo 

yLc  gustarfa  probar  su  mano  en  un  juego  sin  co- 
rrer  el  riesgo  de  perder?  Usted  podria  hacerlo 
simulando  el  proceso  de  los  juegos  de  azar,  hacer 
apuestas  imaginarias  y  observar  los  resultados. 
Esta  tecnica,  llamada  metodo  de  Monte  Carlo, 
es  el  tema  del  Caso  practico  al  final  de  este  ca- 
pftulo. 
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CONSEJO 

Parametro  Poblacion 
Estadistica  •»  Muestra 


INTRODUCTION 

En  los  tres  capftulos  previos,  usted  ha  aprendido  mucho  acerca  de  distribuciones  de 
probabilidad,  por  ejemplo  las  distribuciones  binomiales  y  normales.  La  forma  de  la  dis¬ 
tribution  normal  esta  determinada  por  su  media  p  y  su  desviacion  estandar  er,  mientras 
que  la  forma  de  la  distribucion  binomial  esta  determinada  por  p.  Estas  medidas  numeri- 
cas  descriptivas,  llamadas  parametros,  son  necesarias  para  calcular  la  probabilidad  de 
observar  resultados  muestrales. 

En  situaciones  practicas,  usted  puede  decidir  que  tipo  de  distribucion  de  probabilidad 
usar  como  modelo,  pero  los  valores  de  los  parametros  que  especifican  su  forma  exacta 
se  desconocen.  A  continuation  veamos  dos  ejemplos: 


•  Un  entrevistador  esta  seguro  de  que  las  respuestas  a  sus  preguntas  “de  acuerdo/en 
desacuerdo”  seguiran  una  distribucion  binomial,  pero  se  desconoce  p,  la  propor¬ 
tion  de  quienes  estan  “de  acuerdo”  de  la  poblacion. 

•  Un  agronomo  cree  que  la  production  por  acre  de  una  variedad  de  trigo  esta  dis- 
tribuida  normalmente  en  forma  aproximada,  pero  se  desconocen  la  media  p 

y  desviacion  estandar  a  de  la  production. 


En  estos  casos,  debemos  apoyarnos  en  la  muestra  para  saber  de  estos  parametros.  La 
proportion  de  quienes  estan  “de  acuerdo”  en  la  muestra  del  entrevistador  da  information 
acerca  del  valor  real  de  p.  La  media  y  desviacion  estandar  de  la  muestra  del  agronomo 
aproximan  los  valores  reales  de  p  y  de  a.  jPero,  si  se  desea  que  la  muestra  de  informa- 
cion  confiable  acerca  de  la  poblacion,  la  muestra  debe  ser  seleccionada  en  cierta  forma! 


PLANES  MUESTRALES  Y  DISENOS 
EXPERIMENTALES 

La  forma  en  que  una  muestra  se  selecciona  recibe  el  nombre  de  plan  muestral  o  diseno 
experimental  y  determina  la  cantidad  de  information  de  la  muestra.  Saber  el  plan  mues¬ 
tral  empleado  en  una  situation  particular  permitira  medir  la  conbabilidad  o  bondad  de 
la  inferencia. 

El  muestreo  aleatorio  simple  es  un  plan  muestral  de  uso  comun  en  el  que  cada 
muestra  de  tamano  n  tiene  la  misma  probabilidad  de  ser  seleccionado.  Por  ejemplo, 
supongamos  que  se  desea  seleccionar  una  muestra  de  tamano  77  =  2  de  una  poblacion 
que  contiene  N  =  4  objetos.  Si  los  cuatro  objetos  estan  identibcados  por  los  simbolos  xh 
x2,  x3  y  x4,  hay  seis  pares  distintos  que  podrfan  seleccionarse,  como  se  ve  en  la  tabla  7. 1 . 
Si  la  muestra  de  77  =  2  observaciones  se  selecciona  de  modo  que  cada  una  de  estas  seis 
muestras  tenga  la  misma  probabilidad  de  selection,  dada  por  1/6,  entonces  la  muestra 
resultante  se  denomina  muestra  aleatoria  simple  o  unicamente  muestra  aleatoria. 


TABLA  7.1 


Formas  de  seleccionar  una  muestra  de  tamano  2  de  entre  4  objetos 

Observaciones 

Muestra  en  la  muestra 


1 

2 

3 

4 

5 

6 


*1,*2 
xhx3 
xhxt 
*2,  *3 
*2,  *4 
x3,xt 
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TABLA 


CAPiTULO  7  DISTRIBUCIONES  MUESTRALES 


Definicion  Si  una  muestra  de  n  elementos  se  selecciona  de  entre  una  poblacion  de 
N  elementos,  usando  un  plan  muestral  en  el  que  cada  una  de  las  posibles  muestras  tiene 
la  misma  probabilidad  de  seleccion,  entonces  se  dice  que  el  muestreo  es  aleatorio  y  la 
muestra  resultante  es  una  muestra  aleatoria  simple. 


Un  muestreo  aleatorio  perfecto  es  dificil  de  obtener  en  la  practica.  Si  el  tamano  N 
de  la  poblacion  es  pequeno,  se  podrfa  escribir  cada  uno  de  los  N  numeros  en  una  ficha, 
mezclar  las  fichas  y  seleccionar  una  muestra  de  n  fichas.  Los  numeros  que  seleccione 
corresponden  a  las  n  mediciones  que  aparecen  en  la  muestra.  Como  este  metodo  no 
siempre  es  practico,  un  metodo  mas  sencillo  y  confiable  utiliza  numeros  aleatorios,  es 
decir,  digitos  generados  de  modo  que  los  valores  de  0  a  9  se  presentan  al  azar  y  con  igual 
frecuencia.  Estos  numeros  pueden  ser  generados  por  computadora  o  pueden  incluso  apa- 
recer  en  una  calculadora  cientffica.  De  manera  opcional,  la  tabla  10  del  apendice  I  es  una 
tabla  de  numeros  aleatorios  que  se  pueden  usar  para  seleccionar  una  muestra  aleatoria. 

Una  base  de  datos  de  computadora  en  una  empresa  urbana  de  abogados  contiene  archi- 
vos  para  N  =  1000  clientes.  La  empresa  desea  seleccionar  n  =  5  archivos  para  revision. 
Seleccione  una  muestra  aleatoria  simple  de  cinco  archivos  de  esta  base  de  datos. 


Solucion  Primero  debe  marcar  cada  archivo  con  un  mimero  de  1  a  1000.  Quiza  los 
archivos  se  guarden  alfabeticamente  y  la  computadora  ya  ha  asignado  un  mimero  a  cada 
uno.  A  continuacion  genere  una  secuencia  de  10  numeros  aleatorios  de  tres  digitos.  Si 
esta  usando  la  tabla  10  del  apendice  I,  seleccione  un  punto  inicial  aleatorio  y  use  una 
parte  de  la  tabla  similar  a  la  de  la  tabla  7.2.  El  punto  inicial  aleatorio  asegura  que  usted 
no  use  la  misma  secuencia  una  y  otra  vez.  Los  primeros  tres  digitos  de  la  tabla  7.2  indi¬ 
can  el  mimero  del  primer  archivo  a  revisarse.  El  mimero  aleatorio  001  corresponde  al 
archivo  #1  y  el  ultimo  archivo,  #1000  corresponde  al  mimero  aleatorio  000.  Usando  la 
tabla  7.2,  se  escogerfan  los  cinco  archivos  numerados  155, 450,  32,  882  y  350  para  revi¬ 
sion.  De  manera  opcional,  podrfa  escoger  leer  en  sentido  horizontal  las  lineas  y  escoger 
los  archivos  155,  350,  989,  450  y  369  para  revision. 


.2  Parte  de  una  tabla  de  numeros  aleatorios 


15574 

35026 

98924 

45045 

36933 

28630 

03225 

78812 

50856 

88292 

26053 

21121 

La  situation  descrita  en  el  ejemplo  7.1  se  denomina  estudio  observacional,  porque 
los  datos  ya  existian  antes  que  usted  decidiera  observar  o  describir  las  caracterfsticas 
de  ellos.  La  mayor  parte  de  los  estudios  muestrales,  en  los  que  la  information  se  capta 
con  un  cuestionario,  caen  en  esta  categoria.  Las  bases  de  datos  de  computadora  hacen 
posible  asignar  numeros  de  identification  a  cada  elemento  aun  cuando  la  poblacion  sea 
grande  y  seleccionar  una  muestra  aleatoria  simple.  Tenga  cuidado  al  efectuar  un  estudio 
muestral  y  este  atento  a  estos  problemas  que  se  presentan  con  frecuencia: 

•  No  respuesta:  Usted  ha  seleccionado  su  muestra  aleatoria  y  enviado  sus  cues- 
tionarios,  pero  solo  50%  de  los  entrevistados  devolvio  sus  cuestionarios.  ^Las 
respuestas  que  usted  recibio  son  representativas  de  toda  la  poblacion  o  estan 
sesgadas  porque  solo  quienes  eran  particularmente  obstinados  en  el  tema  fueron 
escogidos  para  responder? 
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•  Cobertura  demasiado  baja:  Usted  ha  seleccionado  su  muestra  aleatoria  usando 
registros  telefonicos  como  una  base  de  datos.  <;_La  base  de  datos  que  uso  siste- 
maticamente  excluye  ciertos  segmentos  de  la  poblacion,  quiza  aquellos  que  no 
tienen  telefono? 

•  Sesgo  verbal:  El  cuestionario  de  usted  puede  tener  preguntas  que  son  demasiado 
complicadas  o  tienden  a  confundir  al  lector.  Posiblemente  las  preguntas  son  sen- 
sibles  por  naturaleza,  por  ejemplo,  Alguna  vez  ha  consumido  usted  drogas?”  o 
“('.Alguna  vez  ha  enganado  en  su  declaration  de  impuestos?”  y  quienes  respon- 
den  no  contestan  con  la  verdad. 

Se  han  disenado  metodos  para  resolver  algunos  de  estos  problemas,  pero  solo  si  usted 
sabe  que  existen.  Si  su  encuesta  esta  sesgada  por  cualquiera  de  estos  problemas,  enton- 
ces  sus  conclusiones  no  seran  muy  confiables,  aunque  haya  seleccionado  una  muestra 
aleatoria. 

Alguna  investigation  realizada  comprende  la  experimentation,  en  la  que  una  con¬ 
dition  experimental  o  tratamiento  se  impone  en  las  unidades  experimentales.  Seleccio- 
nar  una  muestra  aleatoria  simple  es  mas  diffcil  en  esta  situation. 

Una  qufmica  investigadora  esta  sometiendo  a  prueba  un  nuevo  metodo  para  medir  la 
cantidad  de  titanio  (Ti)  en  muestras  de  mineral.  Ella  selecciona  10  muestras  de  mine¬ 
ral  del  mismo  peso  para  su  experimento.  Cinco  de  las  muestras  se  mediran  usando  un 
metodo  estandar  y  las  otras  cinco  usando  el  nuevo  metodo.  Use  numeros  aleatorios  para 
asignar  las  10  muestras  de  mineral  a  los  grupos  nuevo  y  estandar.  ^Estos  datos  represen- 
tan  una  muestra  aleatoria  simple  de  entre  la  poblacion? 

Solucion  Hay  realmente  dos  poblaciones  en  este  experimento.  Estan  formadas  por 
mediciones  de  titanio,  usando  ya  sea  el  metodo  nuevo  o  el  estandar,  para  todas  las  posi- 
bles  muestras  de  mineral  de  este  peso.  Estas  poblaciones  no  existen  en  realidad;  son 
poblaciones  hipoteticas,  imaginadas  en  la  mente  de  la  investigadora.  Entonces,  es  impo- 
sible  seleccionar  una  muestra  aleatoria  simple  usando  los  metodos  del  ejemplo  7.1.  En 
cambio,  la  investigadora  selecciona  lo  que  ella  cree  que  son  10  muestras  representativas 
de  mineral  y  espera  que  estas  muestras  se  comportardn  como  si  se  hubieran  seleccio¬ 
nado  al  azar  de  las  dos  poblaciones. 

La  investigadora  puede,  no  obstante,  seleccionar  al  azar  las  cinco  muestras  a  medir 
con  cada  metodo.  Numere  las  muestras  del  1  al  10.  Las  cinco  muestras  seleccionadas 
para  el  nuevo  metodo  pueden  corresponder  a  cinco  numeros  aleatorios  de  un  digito.  Use 
esa  secuencia  de  digitos  aleatorios  generados  en  una  calculadora  cientffica: 

948247817184610 

Como  no  se  puede  seleccionar  dos  veces  la  misma  muestra  de  mineral,  hay  que  sal- 
tarse  cualquier  digito  que  ya  haya  sido  escogido.  Las  muestras  9,  4,  8,  2  y  7  se  mediran 
usando  el  nuevo  metodo.  Las  otras  muestras,  es  decir  1,  3,  5,  6  y  10,  se  mediran  usando 
el  metodo  estandar. 


Ademas  del  muestreo  aleatorio  simple,  hay  otros  planes  muestrales  con  caracter  alea- 
torio  y,  por  tanto,  dan  una  base  probabilista  para  hacer  inferencias.  Tres  de  esos  planes 
estan  basados  en  muestreo  estratificado,  conglomerado  y  sistematico. 

Cuando  la  poblacion  esta  formada  por  dos  o  mas  subpoblaciones,  llamadas  estratos, 
un  plan  muestral  que  asegura  que  cada  subpoblacion  esta  representada  en  la  muestra  se 
denomina  muestra  aleatoria  estratificada. 


Definicion  Un  muestreo  aleatorio  estratificado  comprende  seleccionar  una  mues¬ 
tra  aleatoria  simple  de  cada  uno  de  un  numero  dado  de  subpoblaciones  o  estratos. 
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Las  opiniones  de  la  ciudadama,  acerca  de  la  construction  de  un  centro  de  artes  inter- 
pretativas,  podrian  ser  recolectadas  usando  una  muestra  aleatoria  estratilicada  con  dis- 
tritos  de  votacion  urbanos  como  estratos.  Las  votaciones  nacionales  suelen  comprender 
alguna  forma  muestral  aleatorio  estratificado  con  estados  como  estratos. 

Se  utiliza  otra  forma  muestral  aleatorio  cuando  las  unidades  muestrales  disponibles 
son  grupos  de  elementos.  llamados  conglomerados.  Por  ejemplo,  una  familia  es  un 
conglomerado  de  personas  que  viven  juntas.  Una  manzana  o  vecindario  de  una  ciudad 
podrian  ser  una  comoda  unidad  muestral  y  podrfa  ser  considerada  un  conglomerado  para 
un  plan  determinado  muestral. 


Definition  Una  muestra  de  conglomerados  es  una  simple  muestra  aleatoria 
tomada  de  los  conglomerados  disponibles  en  la  poblacion. 


Cuando  un  conglomerado  particular  se  incluye  en  la  muestra,  se  toma  un  censo  de  cada 
uno  de  los  elementos  del  conglomerado. 

A  veces  la  poblacion  a  ser  muestreada  esta  ordenada,  por  ejemplo  una  lista  alfabeti- 
zada  de  personas  con  licencias  de  manejo,  una  lista  de  usuarios  de  la  compama  de  luz 
por  direcciones  de  servicio  o  una  lista  de  clientes  por  mimeros  de  cuenta.  En  estas  y  otras 
situaciones,  se  escoge  un  elemento  al  azar  de  los  primeros  k  elementos  y,  a  continuation, 
cada  tiesimo  elemento  de  ahf  en  adelante  se  incluye  en  la  muestra. 


Definition  Una  muestra  aleatoria  sistematica  1  en  k  involucra  la  selection  alea¬ 
toria  de  uno  de  los  primeros  k  elementos  de  una  poblacion  ordenada  y  luego  la  selection 
sistematica  de  cada  tiesimo  elemento  de  ahr  en  adelante. 


Todos  los  planes  muestral 
empleados  para  hacer 
inferencias  comprenden  el 
proceso  aleatorio. 


No  todos  los  planes  muestrales,  sin  embargo,  comprenden  una  selection  aleatoria. 
Es  probable  que  usted  haya  ofdo  de  las  encuestas  telefonicas  no  aleatorias,  en  las  que 
las  personas  que  desean  expresar  apoyo  a  una  pregunta  llaman  a  un  “ntimero  900”  y 
los  que  se  oponen  llaman  a  un  segundo  “ntimero  900”.  Cada  persona  debe  pagar  por 
su  llamada.  Es  obvio  que  quienes  llaman  no  representan  la  poblacion  en  general.  Este 
tipo  muestral  es  una  forma  de  una  muestra  de  conveniencia,  es  decir,  una  muestra  que 
se  puede  obtener  de  manera  facil  y  sencilla  sin  selection  aleatoria.  Hacer  publicidad  a 
personas  a  quienes  se  les  pagara  una  cuota  por  participar  en  un  experimento  produce 
una  muestra  de  conveniencia.  El  muestreo  de  juicio  permite  que  la  persona  que  haga  el 
muestreo  decida  quien  estara  o  no  incluido  en  la  muestra.  El  muestreo  de  cuota,  en  el 
que  la  composition  de  la  muestra  debe  reflejar  la  composition  de  la  poblacion  en  alguna 
caracteristica  preseleccionada,  con  frecuencia  tiene  un  componente  no  aleatorio  en  el 
proceso  de  selection.  Recuerde  que  las  muestras  no  aleatorias  se  pueden  describir 
pero  no  se  pueden  usar  para  hacer  inferencias. 


© 


EJERCICIOS 


TECNICAS  BASICAS 


Unidades 


Numeros 


7.1  Una  poblacion  esta  formada  por  N  =  500  unidades 
experimentales.  Use  una  tabla  numerica  aleatoria  para 
seleccionar  una  muestra  aleatoria  de  n  =  20  unidades 
experimentales.  (sugerencia:  Como  es  necesario  usar 
numeros  de  tres  dfgitos,  se  pueden  asignar  dos  numeros 
de  tres  dfgitos  a  cada  una  de  las  unidades  muestrales  en 
la  forma  ilustrada  en  la  tabla.)  ^Cual  es  la  probabilidad  de 
que  cada  unidad  experimental  sea  seleccionada  para  su 
inclusion  en  la  muestra? 


experimentales  aleatorios 

1  001,501 

2  002, 502 

3  003, 503 

4  004, 504 


499  499, 999 

500  500, 000 
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7.2  Un  analista  politico  desea  seleccionar  una  muestra 
de  n  =  20  personas  de  entre  una  poblacion  de  2000.  Use 
la  tabla  numerica  aleatoria  para  identificar  las  personas  a 
ser  incluidas  en  la  muestra. 

7.3  Una  poblacion  contiene  50  mil  votantes.  Use  la 
tabla  numerica  aleatoria  para  identificar  los  votantes  a  ser 
incluidos  en  una  muestra  aleatoria  dsn  =  15. 

7.4  Una  pequena  ciudad  contiene  20  mil  votantes.  Use 
la  tabla  numerica  aleatoria  para  identificar  los  votantes  a 
ser  incluidos  en  una  muestra  aleatoria  de  n  =  15. 

7.5  Cada  decima  persona  Una  muestra  aleatoria 
de  opinion  publica,  en  una  pequena  ciudad,  se  obtuvo 
al  seleccionar  cada  decima  persona  que  pasara  por  la 
esquina  de  mayor  movimiento  en  el  centra  de  la  ciudad. 

I  Esta  muestra  tendra  las  caracterfsticas  de  una  muestra 
aleatoria  seleccionada  de  entre  los  ciudadanos?  Explique. 

7.6  Parques  y  recreation  Se  envio  por  correo  un 
cuestionario  a  mil  votantes  municipales  registrados 
seleccionados  al  azar.  Solo  500  cuestionarios  fueron 
devueltos  y,  de  estos,  360  que  contestaron  se  oponfan 
rotundamente  a  un  recargo  propuesto  para  sostener  al 
Departamento  de  Parques  y  Recreation  de  la  ciudad. 

I  lista  usted  dispuesto  a  aceptar  la  cifra  de  72%  como 
estimacion  valida  del  porcentaje  en  la  ciudad  que  se 
oponen  al  recargo?  ^Por  que  si  o  por  que  no? 

7.7  Listas  del  DMV  En  muchos  estados, 

unas  listas  de  posibles  miembros  de  jurados  se  conforman 
a  partir  de  listas  de  registro  de  votantes,  asi  como 
de  registros  del  Departamento  de  Vehiculos  a  Motor 
o  conductores  con  licencia  de  manejo  y  propietarios 
de  autos.  ^En  que  formas  podrfa  esta  lista  no  cubrir 
adecuadamente  ciertos  sectores  de  la  poblacion? 

7.8  Sexo  y  violencia  Una  pregun ta  en  un 
cuestionario  de  cierta  encuesta  dice:  “^No  esta  usted  de 
acuerdo  en  que  hay  demasiado  sexo  y  violencia  durante 
las  mejores  horas  en  television?”  Comente  sobre  posibles 
problemas  con  las  respuestas  a  esta  pregunta.  Sugiera  una 
mejor  forma  de  plan  tear  la  pregunta. 

APLICACIONES 

7.9  Cancer  en  ratas  La  publication  Press  Enterprise 
identified  un  producto  derivado  de  la  cloracion  llamado 
MX  que  ha  estado  ligado  al  cancer  en  ratas.1  Un  cientifico 
desea  realizar  un  estudio  de  validacion  usando  25  ratas  en 
el  grupo  experimental,  cada  una  va  a  recibir  una  dosis  fija 
de  MX  y  25  ratas  en  un  grupo  de  control  que  no  recibira 
el  MX.  Determine  el  esquema  de  aleatoriedad  para 
asignar  las  50  ratas  individuales  a  los  dos  grupos. 

7.10  iSesgo  racial?  ^Es  importante  la  carrera  de  un 
entrevistador?  Esta  pregunta  fue  investigada  por  Chris 
Gilberg  y  colegas,  y  publicada  en  una  edicion  de  la  revista 


Chance ,2  El  entrevistador  preguntaba:  “(',Piensa  usted 
que  la  accion  afirmativa  debe  usarse  como  criterios  de 
selection  de  ocupacion?”  con  posibles  respuestas  de  si 
o  no. 

a.  /.Que  problemas  podrfa  usted  esperar  con  respuestas 
a  esta  pregunta  cuando  las  hacen  entrevistadores  de 
diferentes  origenes  etnicos? 

b.  Cuando  las  personas  eran  entrevistadas  por  un 
afroamericano,  la  respuesta  era  alrededor  de  70%  a 
favor  de  una  accion  afirmativa,  aproximadamente  35% 
cuando  eran  entrevistadas  por  un  asiatico  y  alrededor  de 
25%  cuando  eran  entrevistadas  por  un  caucasico.  (  Estos 
resultados  apoyan  su  respuesta  al  inciso  a)? 

7.1 1  Juventud  de  americanos  nativos  En  el 
American  Journal  of  Human  Biology,  Chery  Smith 

y  Stefanie  Fila  publicaron  un  estudio  acerca  de  jovenes 
americanos  nativos  citadinos.3  El  objetivo  del  estudio 
era  determinar  lo  apropiado  de  una  herramienta  de 
evaluation  para  identificar  medidas  de  dieta  para  uso 
en  esta  poblacion.  Los  sujetos  eran  jovenes  americanos 
nativos  que  estudiaban  en  un  programa  despues  de  clase 
en  Minneapolis,  MN.  Los  61  ninos  entre  9  y  13  anos  de 
edad  que  cumplieron  con  los  requisitos  de  los  objetivos 
de  estudio  fueron  incluidos  en  el  experimento. 

a.  Describa  el  plan  muestral  empleado  para  seleccionar 
participantes  de  estudio. 

b.  (,Que  mecanismo  de  probabilidad  se  utilizo  para 
seleccionar  esta  muestra  de  61  adolescentes 
americanos  nativos  de  9  a  13  anos  de  edad? 

c.  (',Se  pueden  hacer  inferencias  validas  usando  los 
resultados  de  este  estudio?  i Por  que  si  o  por  que  no? 

d.  Si  usted  tuviera  que  idear  un  plan  alternativo  muestral, 
(:,que  cambiaria? 

7.12  Adelgazador  de  sangre  Serealizoun 
estudio  de  un  adelgazador  experimental  de  sangre, 
para  determinar  si  funciona  mejor  que  la  simple  tableta 
de  aspirina  para  proteger  de  ataques  al  corazon  y  de 
apoplejias.4  El  estudio,  publicado  en  la  Press  Enterprise, 
comprendio  19  185  personas  que  habian  sufrido  de 
ataques  al  corazon,  apoplejias  o  dolor  de  arterias 
obstruidas.  Cada  una  de  estas  personas  fue  asignada 
para  tomar  ya  fuera  la  aspirina  o  el  medicamento 
experimental  de  1  a  3  anos.  Suponga  que  cada  una  tenia 
la  misma  probabilidad  de  ser  asignada  a  una  de  las  dos 
medicaciones. 

a.  Disene  un  plan  para  hacer  aleatoria  la  asignacion  de 
medicaciones  a  los  pacientes. 

b.  (j  Habra  igual  numero  de  pacientes  en  cada  grupo 
de  tratamiento?  Explique. 

7  3  A  la  Luna  Dos  encuestas  Gallup  diferentes  se 
llevaron  a  cabo  para  CNN/USA  Today,  donde  aparecia  lo 
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que  pensaba  la  sociedad  acerca  del  programa  espacial  de 
Estados  Unidos.5  Veamos  a  continuation  una  pregunta 
de  cada  encuesta,  junto  con  las  respuestas  de  los 
estadounidenses  encuestados 


Exploracion  espacial 

Encuesta  Gallup/CNN/USA  Today:  Dic.5-7, 2003:  nacional: 

“iEstaria  usted  a  favor  o  en  contra  de  un  nuevo  programa  espacial  de 
Estados  Unidos  para  enviar  astronautas  a  la  Luna?”,  Forma  A(N  =  510,  MoE  ±  5) 

No  tiene 

A  favor  En  contra  opinion 

%  %  % 

12/03  53  45  2 

“^Estaria  usted  a  favor  o  en  contra  de  que  el  gobierno  gaste  miles  de  millones 
de  dolares  para  enviar  astronautas  a  la  Luna?”,  Forma  B  (N  =  494,  MoE  ±  5) 

No  tiene 

A  favor  En  contra  opinion 

%  %  % 

12/03  31  67  2 


a.  Lea  las  dos  preguntas  de  la  encuesta.  /.Cual  de  las  dos 
redacciones  esta  mas  insesgada?  Explique. 

b.  Vea  las  respuestas  para  las  dos  encuestas.  /.Como 
explicarfa  usted  las  grandes  diferencias  en  los 


porcentajes  ya  sea  a  favor  o  en  contra  del  nuevo 
programa? 

7.14  Estados  Unidos,  j pregunta!  Una  encuesta  de 
la  polftica  nacional,  titulada  “Estados  Unidos,  jpregunta!” 
fue  enviada  por  la  Comision  Nacional  Republicana 
al  Congreso  a  votantes  del  49  Distrito  del  Congreso, 
pidiendo  opiniones  en  varios  asuntos  politicos.6  A 
continuation  veamos  algunas  preguntas  de  la  encuesta: 

•  En  anos  recientes,  /.el  gobierno  federal  ha  intervenido 
mas,  o  menos,  en  los  asuntos  personales  o 
profesionales  de  usted? 

•  /.Tiene  razon  el  presidente  al  tratar  de  refrenar  el 
tamano  y  alcance  del  gobierno  federal,  contra  los 
deseos  de  los  cinco  grandes  democratas? 

•  /.Piensa  que  la  pena  de  muerte  es  un  factor  disuasivo 
para  la  delincuencia? 

•  /.Esta  usted  de  acuerdo  que  a  los  democratas 
obstruccionistas  no  se  les  permita  obtener  el  control 
del  Congreso  de  Estados  Unidos  en  las  proximas 
elecciones? 

Comente  sobre  el  efecto  del  sesgo  en  la  redaction  sobre 
las  respuestas  reunidas  usando  esta  encuesta. 


ESTADISTICA  Y  DISTRIBUCIONES 
MUESTRALES 

Cuando  se  selecciona  una  muestra  aleatoria  de  una  poblacion,  las  medidas  numericas 
descriptivas  que  se  calculen  de  la  muestra  se  denominan  estadisticas.  Las  estadfsti- 
cas  varfan  o  cambian  para  cada  muestra  aleatoria  diferente  que  se  escoja;  esto  es,  son 
variables  aleatorias.  Las  distributions  de  probabilidad  para  estadisticas  se  llaman  dis- 
tribuciones  muestrales  porque,  en  muestreos  repetidos,  dan  esta  information: 


•  Que  valores  de  la  estadfstica  pueden  presentarse 

•  Con  que  frecuencia  se  presenta  cada  valor 


Definition  La  distribution  muestral  de  una  estadistica  es  la  distribution  de  pro¬ 
babilidad  para  los  posibles  valores  de  la  estadfstica,  que  resulta  cuando  muestras  aleato¬ 
rias  de  tamano  n  se  sacan  repetidamente  de  la  poblacion. 


Hay  tres  formas  de  hallar  la  distribution  muestral  de  una  estadfstica: 

1.  Deducir  la  distribution  matemdticamente  usando  las  leyes  de  probabilidad. 

2.  Usar  una  simulacion  para  aproximar  la  distribution.  Esto  es,  saque  un  gran 

nil  mem  de  muestras  de  tamano  n,  calculando  el  valor  de  la  estadfstica  para  cada 
muestra  y  tabule  los  resultados  en  un  histograma  de  frecuencia  relativa.  Cuando 
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el  niimero  de  muestras  es  grande,  el  histograma  sera  muy  cercano  a  la  distribu- 
cion  teorica  muestral. 

3.  Usar  teoremas  estadisticos  para  obtener  distribuciones  muestrales  exactas  o 
aproximadas. 


EJEMPLO 


El  siguiente  ejemplo  demuestra  como  deducir  las  distribuciones  muestrales  de  dos  esta- 
disticas  para  una  poblacion  muy  pequena. 

Una  poblacion  esta  formada  por  N  =  5  numeros:  3,  6, 9,  12, 15.  Si  una  muestra  aleatoria 
de  tamano  n  =  3  se  selecciona  sin  reemplazo,  encuentre  las  distribuciones  muestrales 
para  la  media  muestral  x  y  la  mediana  m. 


Solucion  Usted  esta  muestreando  de  entre  la  poblacion  que  aparece  en  la  figura  7. 1 . 
Contiene  cinco  numeros  distintos  y  cada  uno  es  igualmente  probable,  con  probabilidad 
p(x)  =  1/5.  Con  facilidad  puede  hallar  la  media  poblacional  y  mediana  como 


P-  - 


3  +  6  +  9+12+15 
5 


9  y  M  =  9 


FIGURA  7.1 

Histograma  de 
probabilidad  para  ios 
N  =  5  valores 
poblacionales  del 
ejemplo  7.3 


P(x) 

.4 


-Ar 


l  l  l  l  l  l  l  l 


12 


15  x 


CONSEJO 


Las  distribuciones  muestrales 
pueden  ser  discretas  o 
continuas. 


Hay  10  posibles  muestras  aleatorias  de  tamano  n  =  3  y  cada  una  de  ellas  es  igualmente 
probable,  con  probabilidad  1/10.  Estas  muestras,  junto  con  los  valores  calculados  de  x 
y  m  para  cada  una,  se  ven  en  la  tabla  7.3.  Usted  observara  que  algunos  valores  de  x  son 
mas  probables  que  otros  porque  se  presentan  en  mas  de  una  muestra.  Por  ejemplo, 

P(x  =  8)  =  —  =  .2  y  P{m  =  6)  =  —  =  .3 
v  10  J  10 

Los  valores  de  la  tabla  7.3  estan  tabulados,  y  las  distribuciones  muestrales  para  x  y  m  se 
ven  en  la  tabla  7.4  y  la  figura  7.2. 

Como  la  poblacion  de  N  =  5  valores  es  simetrica  cerca  del  valor  de  x  =  9,  la  media 
poblacional  y  la  mediana  son  iguales  a  9.  Parecerfa  razonable,  por  tanto,  considerar  usar 
ya  sea  x  o  m  como  estimador  posible  de  M  =  p  =  9.  (:  Cual  estimador  escogerfa  usted?  De 
la  tabla  7.3  se  ve  que,  al  usar  m  como  estimador,  estarfa  en  un  error  de  9  —  6  =  3  con  pro¬ 
babilidad  .3  o  de  9  —  12  =  —3  con  probabilidad  .3.  Esto  es,  el  error  en  estimacion  usan- 
do  m  serfa  3  con  probabilidad  .6.  Al  usar  x,  no  obstante,  un  error  de  3  ocurrirfa  con  pro¬ 
babilidad  de  solo  .2.  Solo  en  estos  casos,  podrfa  usarse  x  como  estimador  en  preferencia 
sobre  m. 
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TABLA  7.3  Valores  de  x  y  m  para  muestreo  aleatorio  simple  cuando  n  =  3yN=5 


Muestra  Valores  muestrales  x  m 


1 

3,  6,9 

6 

6 

2 

3,  6,12 

7 

6 

3 

3,  6,15 

8 

6 

4 

3,  9,12 

8 

9 

5 

3,  9,15 

9 

9 

6 

3, 12, 15 

10 

12 

7 

6,  9,12 

9 

9 

8 

6,  9,15 

10 

9 

9 

6, 12,  15 

11 

12 

10 

9, 12,  15 

12 

12 

TABLA  7.4 


Distribuciones  muestrales  para  a)  la  media  muestral  y  b)  la  mediana 
muestral 


a)  x  p[x) 

B  .1 

7  .1 

8  .2 

9  .2 

10  .2 

11  .1 

12  .1 


b )  m  p[m ) 

6  .3 

9  .4 

12  .3 


FIGURA  7.2 


Histogramas  de 

PW 

p{m) 

probabilidad  para  las 

.4 

.4  - 

distribuciones  muestrales 

de  la  media  muestral,  x  y 

.3 

.3  - 

la  mediana  muestral,  m, 

del  ejemplo  7.3 

_ A _ 1 _ 1 _ 1 _ 1 _ 1 _ 1 _ 1 _ 

6  7  8  9  10  11  12  *  6  7  8  9  10  11  12  m 


CONSEJO 


Casi  toda  estadistica  tiene 
una  media  y  una  desviacion 
estandar  (o  error  estandar) 
que  describe  su  centra  y 
dispersion. 


No  fue  diffcil  deducir  estas  distribuciones  muestrales  en  el  ejemplo  7.3  porque  el 
numero  de  elementos  en  la  poblacion  era  muy  pequeno.  Cuando  este  no  es  el  caso,  puede 
que  sea  necesario  usar  uno  de  estos  metodos: 

•  Use  una  simulacion  para  aproximar  la  distribucion  muestral  de  manera 
empfrica. 

•  Apoyese  en  teoremas  estadfsticos  y  resultados  teoricos. 

Un  teorema  estadistico  importante,  que  describe  la  distribucion  muestral  de  estadisti- 
cas  que  son  sumas  o  promedios,  se  presenta  en  la  siguiente  seccion. 
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EL  TEOREMA  DEL  LIMITE  CENTRAL 

El  teorema  del  limite  central  dice  que,  bajo  condiciones  mas  bien  generates,  las  sumas 
y  medias  de  muestras  aleatorias  de  mediciones  tomadas  de  una  poblacion  tienden  a  tener 
una  distribucion  aproximadamente  normal.  Suponga  que  se  tira  un  dado  balanceado  n  =  1 
vez.  La  variable  aleatoria  x  es  el  numero  observado  en  la  cara  superior.  Esta  variable  alea- 
toria  conocida  puede  tomar  seis  valores,  cada  uno  con  probabilidad  1/6  y  su  distribucion 
de  probabilidad  se  muestra  en  la  figura  7.3.  La  forma  de  la  distribucion  es  plana  o  uni- 
forme  y  simetrica  alrededor  de  la  media  p  =  3.5,  con  una  desviacion  estandar  er  =  1.71. 
(Vease  la  seccion  4.8  y  el  ejercicio  4.84.) 


FiniinA  v  n 


Ahora,  tome  un  tarnano  muestral  de  n  =  2  de  esta  poblacion;  esto  es,  tire  dos  veces 
el  dado  y  registre  la  suma  de  los  numeros  de  las  dos  caras  superiores,  =  xl  +  x2.  La 
tabla  7.5  muestra  los  36  posibles  resultados,  cada  uno  con  probabilidad  1/36.  Las  sumas 
estan  tabuladas  y  cada  una  de  las  posibles  sumas  esta  dividida  entre  n  =  2  para  obte- 
ner  un  promedio.  El  resultado  es  la  distribucion  muestral  de  x  =  Xxjn,  que  se  ve  en 
la  figura  7.4.  Usted  debe  observar  la  considerable  diferencia  en  la  forma  de  la  distribu¬ 
cion  muestral.  Ahora  tiene  casi  forma  de  monticulo  pero  todavfa  es  simetrica  alrededor 
de  la  media  p  =  3.5. 


TABLA  7.5 


Sumas  de  las  caras  superiores  de  dos  dados 


Probability^  D/36  =00 
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Usando  el  MINITAB,  generamos  las  distribuciones  muestrales  de  x  cuando  n  =  3  y 
n  =  4.  Para  n  =  3,  la  distribucion  muestral  de  la  figura  7.5  con  toda  claridad  muestra 
la  forma  de  monticulo  de  la  distribucion  normal  de  probabilidad,  todavfa  centrada  en 
=  3.5.  Observe  tambien  que  la  dispersion  de  la  distribucion  es  lentamente  decreciente 
cuando  aumenta  el  tamano  muestral  n.  La  figura  7.6  muestra  la  forma  espectacular  que 
la  distribucion  de  x  esta  distribuida  normalmente  en  forma  aproximada  con  base  en  una 
muestra  de  solo  n  =  4.  Este  fenomeno  es  el  resultado  de  un  importante  teorema  estadfs- 
tico  llamado  teorema  del  limite  central  (TLC). 


FinilRA  V  fi 
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Teorema  del  Si  muestras  aleatorias  de  n  observaciones  se  sacan  de  una  poblacion  no  normal  con 

li'mite  central  media  finita  pu  y  desviacion  estandar  cr,  entonces,  cuando  n  es  grande,  la  distribucion  de 

muestreo  de  la  media  muestral  3c  esta  distribuida  normalmente  en  forma  aproximada, 
con  media  p,  y  desviacion  estandar 

cr 

Vn 

La  aproximacion  se  hace  mas  precisa  cuando  n  se  hace  grande. 


Cualquiera  que  sea  su  forma,  la  distribucion  muestral  de  x  siempre  tiene  una  media 
identica  a  la  media  de  la  poblacion  muestreada  y  una  desviacion  estandar  igual  a  la 
desviacion  poblacional  estandar  cr  dividida  entre  Vn.  En  consecuencia,  la  dispersion 
de  la  distribucion  de  medias  muestrales  es  considerablemente  menor  que  la  disper¬ 
sion  de  la  poblacion  muestreada. 

El  teorema  del  lfmite  central  se  puede  expresar  de  otro  modo  para  aplicar  a  la  suma 
de  las  mediciones  muestrales  Xx h  que,  cuando  n  se  hace  grande,  tambien  tiene  una 
distribucion  aproximadamente  normal  con  media  np.  y  desviacion  estandar  oVn. 


El  applet  Java  llamado  The  Central  Limit  Theorem  (El  teorema  del  limite  cen¬ 
tral)  se  puede  usar  para  efectuar  una  simulacion  para  las  distribuciones  muestra¬ 
les  del  promedio  de  uno,  dos,  tres  o  cuatro  dados.  La  figura  7.7  muestra  el  applet 
despues  de  que  el  par  de  dados  (n  =  2)  ha  sido  tirado  2500  veces.  Esto  no  es  tan 
dificil  como  parece,  puesto  que  solo  hay  que  presionar  el  boton  25  veces. 

La  simulacion  muestra  los  posibles  valores  para  x  =  Xx/10  y  tambien  mues¬ 
tra  la  media  y  desviacion  estandar  para  estas  2500  mediciones.  La  media,  3.5, 
es  exactamente  igual  a  p,  =  3.5.  ^Cual  es  la  desviacion  estandar  para  estas  2500 

171 

mediciones?  ^Es  cercana  al  valor  teorico,  a/Vn  =  —  =1.21?  Usaremos  este 

V2 

applet  otra  vez  para  los  ejercicios  Mi  Applet  al  final  del  capitulo. 


FIGURA  7.7 

Applet  Central  Limit 
Theorem  (Teorema  del 
limite  central) 


Rollintj  Two  Dice 


10  Means: 

2.0  5.0  3.0  3.0  3.5  2.5  3.0  4.5  2.5 


xb  a  r 
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CONSEJO 

La  distribucion  muestral  de  x 
siempre  tiene  una  media  /uy 
desviacion  estandar 
cr/Vn.  El  teorema  del  limite 
central  ayuda  a  describir  su 
forma. 


La  aportacion  importante  del  teorema  del  limite  central  esta  en  la  inferencia  esta- 
distica.  Muchos  estimadores  que  se  usan  para  hacer  inferences  acerca  de  parametros 
poblacionales  son  sumas  o  promedios  de  las  mediciones  muestrales.  Cuando  el  tamano 
muestral  es  grande  lo  suficiente,  se  puede  esperar  que  estos  estimadores  tengan  dis- 
tribuciones  muestral  que  sean  aproximadamente  normales.  Entonces  se  puede  usar  la 
distribucion  normal  para  describir  el  comportamiento  de  estos  estimadores  en  muestreo 
repetido  y  evaluar  la  probabilidad  de  observar  ciertos  resultados  muestrales.  A1  igual 
que  en  el  capitulo  6,  estas  probabilidades  se  calculan  usando  la  variable  aleatoria  nor¬ 
mal  estandar 


Estimador  —  Media 

7  =  - : - 

Desviacion  estandar 


Cuando  vuelva  usted  a  leer  el  teorema  del  limite  central,  podra  ver  que  la  aproxi- 
macion  es  valida  mientras  el  tamano  muestral  n  sea  “grande”,  pero  y,que  tan  grande  es 
“grande”?  Desafortunadamente,  no  hay  una  respuesta  clara  a  esta  pregunta.  El  valor 
apropiado  de  n  depende  de  la  forma  de  la  poblacion  de  la  cual  se  muestrea,  y  como  se 
desea  usar  la  aproximacion.  No  obstante,  ayudan  estas  guias: 


i COMO  DETERMINO  CUANDO  EL  TAMANO 
MUESTRAL  ES  LO  SUFICIENTE  GRANDE? 

•  Si  la  poblacion  muestreada  es  normal,  entonces  la  distribucion  muestral  de  x 
tambien  sera  normal,  sin  importar  cual  sea  el  tamano  de  la  muestra  que  se  escoja. 
Este  resultado  se  puede  demostrar  en  forma  teorica,  pero  no  debe  ser  demasiado 
dificil  aceptarla  sin  prueba. 

•  Cuando  la  poblacion  muestreada  es  aproximadamente  simetrica,  la  distribucion 
muestral  de  x  se  hace  tambien  aproximadamente  normal  para  valores  relativa- 
mente  pequenos  de  n.  Recuerde  la  rapidez  con  la  que  la  distribucion  “plana”  del 
ejemplo  de  los  dados  tomo  la  forma  de  monticulo  (n  =  3). 

•  Cuando  la  poblacion  muestreada  esta  sesgada,  el  tamano  muestral  n  debe  ser  mas 
grande,  con  n  al  menos  30  antes  que  la  distribucion  muestral  de  x  se  haga  aproxi¬ 
madamente  normal. 

Estas  guias  sugieren  que,  para  muchas  poblaciones,  la  distribucion  muestral  de  x  sera 
aproximadamente  normal  para  tamanos  muestrales  moderados:  una  excepcion  a  esta 
regia  se  presenta  al  muestrear  una  poblacion  binomial  cuando  p  o  q  =  ( 1  —  p)  es  muy 
pequena.  Cuando  aparezcan  aplicaciones  especificas  del  teorema  del  limite  central, 
daremos  el  tamano  muestral  apropiado  n. 


LA  DISTRIBUCION  MUESTRAL 
DE  LA  MEDIA  MUESTRAL 

Si  la  media  poblacional  p,  es  desconocida,  se  pueden  seleccionar  varias  estadfsticas 
como  estimador;  la  media  muestral  x  y  la  mediana  muestral  m  son  dos  que  con  facilidad 
llegan  a  nuestra  mente.  ^Cual  debe  usarse?  Considere  estos  criterios  al  seleccionar  el 
estimador  para  p: 
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•  Es  facil  o  diffcil  de  calcular? 

•  ^Produce  estimaciones  que  sean  demasiado  altas  o  demasiado  bajas  de  manera 
consistente? 

•  Es  mas  o  menos  variable  que  otros  esdmadores  posibles? 

Las  distribuciones  muestrales  para  x  y  m  con  n  =  3  para  la  pequena  poblacion  del  ejem- 
plo  7.3  mostraron  que,  en  terminos  de  estos  criterios,  la  media  muestral  funciono  mejor 
que  la  mediana  muestral  como  estimador  de  /x.  En  muchas  situaciones,  la  media  mues¬ 
tral  x  tiene  propiedades  deseables  como  un  estimador  que  no  son  compartidas  por  otros 
estimadores  competidores;  por  tanto,  se  emplea  en  forma  mas  general. 


LA  DISTRIBUCION  MUESTRAL  DE  LA  MEDIA 
MUESTRAL,  x 

•  Si  una  muestra  aleatoria  de  n  mediciones  se  selecciona  de  una  poblacion  con 
media  [x  y  desviacion  estandar  er,  la  distribucion  muestral  de  la  media  muestral  x 
tendra  media  jx  y  desviacion  estandar' 

a 

Vn 

•  Si  la  poblacion  tiene  una  distribucion  normal,  la  distribucion  muestral  de  x  estara 
exactamente  distribuida  en  forma  normal,  cualquiera  que  sea  el  tamailo  muestral 
n. 

•  Si  la  distribucion  poblacional  es  no  normal,  la  distribucion  muestral  de  x  estara 
distribuida  normalmente  en  forma  aproximada  para  muestras  grandes 

(por  el  teorema  del  lfmite  central). 


Error  estandar 


Definicion  La  desviacion  estandar  de  una  estadfstica  empleada  como  estimador  de 
un  parametro  poblacional  tambien  se  denomina  error  estandar  del  estimador  (abre- 
viado  SE)  porque  se  refiere  a  la  precision  denomina.  Por  tanto,  la  desviacion  estandar 
de  x,  dada  por  a/Vn,  se  conoce  como  error  estandar  de  la  media  (abreviada  SE(x)  o 
solo  SE). 


^Cuando  muestras  repetidas  de  tamano  n  se  seleccionan  al  azar  de  entre  una  poblacion  finita  con  elementos 
cuya  media  sea  /x  y  cuya  varianza  sea  cr2,  la  desviacion  estandar  de  x  es 

cr  a  In  —  n 
Vn  v  N  —  l 

donde  tr2  es  la  varianza  poblacional.  Cuando  N  es  grande  con  respecto  al  tamano  muestral  n,  ^J(N  —  n)(N  —  1)  es 
aproximadamente  igual  a  1,  y  la  desviacion  estandar  de  x  es 

a 

Vn 
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muestral  x? 

Si  se  sabe  que  la  distribucion  muestral  de  x  es  normal  o  normalmente  aproximada,  se 
puede  describir  el  comportamiento  de  la  media  muestral  x  al  calcular  la  probabilidad 
de  observar  ciertos  valores  de  x  en  muestreo  repetido. 

1.  Encuentre  p  y  calcule  SE  (x)  =  cr/Vn. 

2.  Escriba  el  evento  de  interes  en  terminos  de  x  y  localice  el  area  apropiada  en  la 
curva  normal. 

3.  Convierta  los  valores  necesarios  de  x  en  valores  z  usando 

x  —  p 
cr/Vn 

4.  Use  la  tabla  3  del  apendice  I  para  calcular  la  probabilidad. 

Repertorio  de  ejercicios  (Llene  los  espacios  en  bianco) 

A.  Usted  toma  una  muestra  aleatoria  de  tamano  n  =  36  de  una  distribucion  con 
media  p  =  75  y  <r  =  12.  La  distribucion  muestral  de  x  sera  aproximadamente 

_ con  una  media  de _ y  una  desviacion  estandar  (o  error  estandar) 

de _ 

B .  Para  hallar  la  probabilidad  de  que  la  media  muestral  exceda  de  80,  anote  el  evento 

de  interes. _ 

Cuando  x  =  80, 

x  —  p  _ 
cr/Vn 

Encuentre  la  probabilidad: 

P(x  > _ )  =  P(z  > _ )  =  1  - _ = _ 

C.  Para  hallar  la  probabilidad  de  que  la  media  muestral  sea  entre  70  y  72,  anote  el 

evento  de  interes _ 

Cuando  x  =  70  y  x  =  72, 

x  -  p  = _ y  _  =  x  -  p  = _ 

cr/Vn  Z  cr/Vn 

Encuentre  la  probabilidad: 

P( _ <  x  < _ )  =  P( _ <  z  < _ ) 


Informe  de  progreso 

•  ('  Todavfa  tiene  problemas?  Trate  de  nuevo  usando  el  Repertorio  de  ejercicios 
del  final  de  esta  seccion. 

•  ;Ya  domina  la  tabla  z?  Puede  saltarse  el  Repertorio  de  ejercicios  del  final  de 
esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 


www.FreeLibros.me 


7.5  LA  DISTRIBUCION  MUESTRAL  DE  LA  MEDIA  MUESTRAL  O  269 


La  duracion  de  la  enfermedad  de  Alzheimer  desde  el  principle*  de  sfntomas  hasta  el  falle- 
cimiento  varfa  de  3  a  20  anos;  el  promedio  es  8  anos  con  una  desviacion  estandar  de  4 
anos.  El  administrador  de  un  gran  centra  medico  al  azar  selecciona  los  registros  medicos 
de  30  pacientes  de  Alzheimer  ya  fallecidos,  de  la  base  de  datos  del  centra  medico  y  anota 
la  duracion  promedio.  Encuentre  las  probabilidades  aproximadas  para  estos  eventos: 


1.  La  duracion  promedio  es  menor  a  7  anos. 

2.  La  duracion  promedio  excede  de  7  anos. 

3.  La  duracion  promedio  esta  a  no  mas  de  1  ano  de  la  media  poblacional  /j.  =  8. 


CONSEJO 


Si  xes  normal,  x  es  normal 
para  cualquier  n. 


Si  xno  es  normal,  x  es 
aproximadamente  normal 
para  n  grande. 


Solucion  Como  el  administrador  ha  seleccionado  una  muestra  grande  de  la  base 
de  datos  en  este  centra  medico,  puede  sacar  conclusiones  acerca  de  pacientes  pasados, 
presentes  o  futuros  con  enfermedad  de  Alzheimer  en  este  centro  medico.  Si,  por  el  con- 
trario,  este  centro  medico  puede  ser  considerado  como  representative  de  otros  centros 
medicos  del  pais,  puede  ser  posible  sacar  conclusiones  de  mas  largo  alcance. 

(;Que  se  puede  decir  acerca  de  la  forma  de  la  poblacion  muestreada?  No  es  simetrica, 
porque  la  media  jn  =  8  no  esta  a  la  mitad  entre  los  valores  maximo  y  minimo.  Como 
la  media  esta  mas  cercana  al  valor  mmimo,  la  distribucion  esta  sesgada  a  la  derecha, 
con  unos  pocos  pacientes  viviendo  largo  tiempo  despues  que  principia  la  enfermedad. 
Cualquiera  que  sea  la  forma  de  la  distribucion  poblacional,  no  obstante,  la  distribucion 
muestral  de  x  tiene  una  media  de  fi  =  8  y  desviacion  estandar  a/Vn  =  4/V30  =  .73. 
Ademas,  como  el  tamano  muestral  es  n  =  30,  el  teorema  del  lfmite  central  asegura  la 
normalidad  aproximada  de  la  distribucion  muestral  de  x. 


1 .  La  probabilidad  de  que  x  sea  menor  a  7  esta  dada  por  el  area  sombreada  de  la  h- 
gura  7.8.  Para  hallar  esta  area,  es  necesario  calcular  el  valor  de  z  correspondiente 
a  x  =  7: 


Z_J±  =  7-8 
a/Vn  .73 


De  la  tabla  3  del  apendice  I  se  puede  hallar  el  area  acumulativa  correspondiente  a 
z  =  -1.37  y 

P(x  <  7)  =  P(z  <  -1.37)  =  .0853 


FIGURA  7.8 

Probabilidad  de  que  x  sea 
menor  a  7  para  el 
ejemplo  7.4 


fix) 


[nota:  Se  debe  usar  a/Vn  (no  &)  en  la  formula  para  z  porque  estamos  buscando  un  area 
bajo  la  distribucion  muestral  para  x,  no  bajo  la  distribucion  de  probabilidad  para  x.] 
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CONSEJO 


Recuerde  que  para  variables 
aleatorias  continuas,  no  hay 
probabilidad  asignada  a  un 
punto  solo.  Portanto, 

P(x<  7)  =  P(x  <  7). 


2.  El  evento  de  que  x  exceda  de  7  es  el  complementer  del  evento  que  x  sea  menor  a 
7.  Entonces,  la  probabilidad  de  que  x  exceda  de  7  es 
P(x  >  7)  =  1  —  P(x  <  7) 

=  1  -  .0853  =  .9147 


3.  La  probabilidad  de  que  x  se  encuentre  a  no  mas  de  1  ano  de  ji  =  8  es  el  area 
sombreada  en  la  figura  7.9.  El  valor  z  correspondiente  a  x  =  7  es  z  =  — 1.37,  del 
inciso  1  y  el  valor  z  para  x  =  9  es 


x  —  [x  =  9-8 
alx/n  .73 


-1.37 


La  probabilidad  de  interes  es 

P{1  <x<9)  =  P{~\31  <z<  1.37) 


=  .9147  -  .0853  =  .8294 


FIGURA  7.9 

La  probabilidad  de  que  x 
se  encuentre  a  no  mas  de 
1  ano  de  fj.  =  8  para  el 
ejemplo  7.4 


-1.37  0  1.37 


El  ejemplo  7.4  se  puede  resolver  usando  el  applet  Normal  Probabilities  for  Means 
(Probabilidades  normales  para  medias).  Si  usted  tec  lea  los  valores  para  x,  a,  jx  y  // 
(presiona  “Enter”  para  registrar  cada  uno  de  los  cambios)  y  ajusta  la  lista  descendente 
que  esta  en  la  parte  inferior  del  applet,  puede  calcular  el  area  a  la  derecha  o  izquierda 
de  Zq,  el  area  en  dos  colas  o  el  area  entre  -Zo  y  Z<>-  Por  el  contrario,  si  necesita  hallar 
el  valor  de  x  que  corta  cierta  superficie  bajo  la  curva,  introduzca  el  area  en  la  caja 
marcada  “prob:”  en  la  parte  inferior  del  applet  y  este  dara  el  valor  de  x.  El  applet  de 
la  figura  7.10  esta  ajustado  para  calcular  P{1  <x<  9)  =  .829  correcta  a  tres  lugares 
decimales.  Usted  usara  este  applet  para  los  ejercicios  Mi  Applet  del  final  de  este 
capitulo. 
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Para  evitar  dificultades  con  la  Comision  Federal  de  Comercio  de  EE.UU.  o  con  oficinas 
locales  y  estatales  de  proteccion  al  consumidor,  un  embotellador  de  refrescos  debe  estar 
razonablemente  seguro  de  que  sus  bote  lias  de  12  onzas  en  realidad  contengan  12  onzas 
de  liquido.  Para  determinar  si  una  maquina  esta  funcionando  de  manera  satisfactoria, 
un  embotellador  muestrea  al  azar  10  botellas  por  hora  y  mide  la  cantidad  de  liquido  de 
cada  botella.  La  media  x  de  las  10  medidas  llenas  se  usa  para  determinar  si  se  reajusta 
la  cantidad  de  liquido  introducido  en  la  botella  por  la  maquina  llenadora.  Si  los  registros 
muestran  que  la  cantidad  de  liquido  por  botella  esta  normalmente  distribuida,  con  una 
desviacion  estandar  de  .2  onzas  y  si  la  maquina  embotelladora  esta  ajustada  para  produ- 
cir  un  llenado  medio  por  botella  de  12.1  onzas,  ^cual  es  la  probabilidad  aproximada  de 
que  la  media  muestral  x  de  las  10  botellas  sea  menor  a  12  onzas? 

Solucion  La  media  de  la  distribucion  muestral  de  la  media  muestral  x  es  identica  a  la 
media  de  la  poblacion  de  llenados  de  botella,  es  decir,  ju  =  12. 1  onzas  y  el  error  estandar 
(SE)  de  x  es 


SF  =  °~  = 

VH-  VIo 


.063 


(nota:  cres  la  desviacion  estandar  de  la  poblacion  de  llenados  de  botella  y  n  es  el  mimero 
de  botellas  de  la  muestra.)  Como  la  cantidad  de  llenado  esta  distribuida  normalmente, 
x  tambien  esta  distribuida  normalmente,  como  se  ve  en  la  figura  7.11. 

Para  hallar  la  probabilidad  de  que  x  sea  menor  a  12  onzas,  exprese  el  valor  x  =  12  en 
unidades  de  desviacion  estandar: 


x  —  [x  =  12  -  12.1 
Z  crlVn  .063 
Entonces 


-1.59 


P(x  <  12)  =  P(z  <  -1.59)  =  .0559  «  .056 
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FIGURA  7.11 

Distribucion  de 
probabilidad  de  x,  la  media 
de  los  n  =  10  llenados  de 
botellas,  para  el  ejemplo 
7.5 


-1.59  0 


Entonces,  si  la  maquina  esta  ajustada  para  producir  un  llenado  promedio  de  12.1  onzas, 
el  llenado  medio  x  de  una  muestra  de  10  botellas  sera  me  nor  a  12  onzas  con  una  proba¬ 
bilidad  igual  a  .056.  Cuando  se  presenta  esta  serial  de  riesgo  ( x  es  menor  a  12),  el  embo- 
tellador  toma  una  muestra  mas  grande  para  volver  a  verificar  el  ajuste  de  la  maquina 
llenadora. 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 
(LLENE  LOS  ESPACIOS  EN  BLANCO) 


Estos  ejercicios  se  ref i ere  n  a  la  seccion  Mi  en  tree  ad  or  personal  de  la  pagina  268. 

7.15  Se  toma  una  muestra  aleatoria  de  tamano  n  =  49  de  una  distribucion  con  media  de 

/x  =  53  v  <r  =  21.  La  distribucion  muestral  de  x  sera  aproximadamente _ con  una 

media  de _ y  una  desviacion  estandar  (o  error  estandar)  de _ 

7.16  Consulte  el  ejercicio  7.15.  Para  hallar  la  probabilidad  de  que  la  media  muestral  sea 

mayor  a  55,  anote  el  evento  de  interes. _ Cuando  x  =  55, 

x  —  ix 
cr/Vn 


Encuentre  la  probabilidad: 

P(x  > _ )  =  P(z  > _ )  =  1  - _ = _ 

7.17  Se  toma  una  muestra  aleatoria  de  tamano  n  =  40  de  una  distribucion  con  media 

p,  =  100  y  cr  =  20.  La  distribucion  muestral  de  x  sera  aproximadamente _ con  una 

media  de _ y  una  desviacion  estandar  (o  error  estandar)  de _ 

7.18  Consulte  el  ejercicio  7.17.  Para  hallar  la  probabilidad  de  que  la  media  muestral  sea 

entre  105  y  1 10,  anote  el  evento  de  interes. _ Cuando  x  =  105  y  x  =  110, 

X  —  P  X  —  IX 

cr/Vn  ^ 4  cr/Vn 

Encuentre  la  probabilidad: 

P( _ <  x  < _ )  =  P( _ <  z  < _ ) 
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TECNICAS  BASICAS 

7.19  Muestras  aleatorias  de  tamano  n  se  seleccionaron 
de  poblaciones  con  las  medias  y  varianzas  dadas 

aquf.  Encuentre  la  media  y  desviacion  estandar  de  la 
distribucion  muestral  de  la  media  muestral  en  cada 
caso: 

a.  n  =  36,  fx  =  10,  a1  =  9 

b.  n  =  100,  ix  =  5,  a2  =  4 

c.  n  =  8,  jx  =  120,  a2  =  1 

7.20  Consulte  el  ejercicio  7.19. 

a.  Si  las  poblaciones  muestreadas  son  normales,  <;cual  es 
la  distribucion  muestral  de  x  para  los  incisos  a), 

b)  y  c)? 

b.  De  acuerdo  con  el  teorema  del  lfmite  central,  si  las 
poblaciones  muestreadas  no  son  normales,  <,que  se 
puede  decir  acerca  de  la  distribucion  muestral  de 

3c  para  los  incisos  a),  b)  y  c)? 

datos  7.21  Una  poblacion  esta  formada  por  N  =  5 
numeros:  1,  3,  5,  6  y  7.  Se  puede  demostrar  que 
la  media  y  desviacion  estandar  para  esta  poblacion  son 
/x  =  4.4  y  a  =  2.15,  respectivamente. 

a.  Construya  un  histograma  de  probabilidad  para  esta 
poblacion. 

b.  Use  la  tabla  de  numeros  aleatorios,  tabla  10  del 
apendice  I,  para  seleccionar  una  muestra  aleatoria  de 
tamano  n  =  10  con  remplazo  de  la  poblacion.  Calcule 
la  media  muestral,  x.  Repita  este  procedimiento, 
calculando  la  media  muestral  3c  para  su  segunda 
muestra.  (sugerencia:  Asigne  los  dfgitos  aleatorios  0  y 
1  a  la  medicion  x  =  1 ;  asigne  dfgitos  2 

y  3  a  la  medicion  x  =  3  y  asf  sucesivamente.) 

c.  Para  simular  la  distribucion  muestral  de  3c,  hemos 
seleccionado  50  muestras  mas  de  tamano  n  =  10  con 
restitucion  y  hemos  calculado  las  correspondientes 
medias  muestrales.  Construya  un  histograma  de 
frecuencia  relativa  para  estos  50  valores  de  3c.  <:Cual 
es  la  forma  de  esta  distribucion? 


4.8 

4.2 

4.2 

4.5 

4.3 

4.3 

5.0 

4.0 

3.3 

4.7 

3.0 

5.9 

5.7 

4.2 

4.4 

4.8 

5.0 

5.1 

4.8 

4.2 

4.6 

4.1 

3.4 

4.9 

4.1 

4.0 

3.7 

4.3 

4.3 

4.5 

5.0 

4.6 

4.1 

5.1 

3.4 

5.9 

5.0 

4.3 

4.5 

3.9 

4.4 

4.2 

4.2 

5.2 

5.4 

4.8 

3.6 

5.0 

4.5 

4.9 

7.22  Consulte  el  ejercicio  7.21. 

a.  Use  el  metodo  de  entrada  de  datos  de  su  calculadora 
para  hallar  la  media  y  desviacion  estandar  de  los  50 
valores  de  3c  dados  en  el  ejercicio  7.21,  inciso  c). 

b.  Compare  los  valores  calculados  en  el  inciso  a)  contra 
la  media  teorica  /x  y  la  desviacion  estandar  teorica  cr/ 


Vn  para  la  distribucion  muestral  de  x.  ^Que  tanto  se 
acercan  los  valores  calculados  de  las  50  mediciones  a 
los  valores  teoricos? 

7.23  Una  muestra  aleatoria  de  n  observaciones  se 
selecciona  de  una  poblacion  con  desviacion  estandar 
cr  =  1 .  Calcule  el  error  estandar  de  la  media  (SE)  para 
estos  valores  de  n: 

a.  n  =  1  b.  n  =  2  c.  n  =  4 

d.  n  =  9  e.  n  =  16  f.  n  =  25 

g.  n  =  100 

7.24  Consulte  el  ejercicio  7.23.  Grafique  el  error 
estandar  de  la  media  (SE)  contra  el  tamano  muestral  n 
y  enlace  los  puntos  con  una  curva  suave.  ^Cual  es  el 
efecto  de  aumentar  el  tamano  muestral  sobre  el  error 
estandar? 

7.25  Suponga  que  se  selecciona  una  muestra  aleatoria 
de  n  =  25  observaciones  de  entre  una  poblacion  que 
esta  distribuida  normalmente,  con  media  igual  a  106  y 
desviacion  estandar  igual  a  12. 

a.  De  la  media  y  desviacion  estandar  de  la  distribucion 
muestral  de  la  media  muestral  3c. 

b.  Encuentre  la  probabilidad  de  que  x  exceda  de  110. 

c.  Encuentre  la  probabilidad  de  que  la  media  muestral 
se  desvfe  de  la  media  poblacional  fx  =  106  en  no  mas 
de  4. 

APLICACIONES 

7.26  Salarios  de  profesorado  Suponga  que  el 
profesorado  de  una  universidad,  con  el  rango  de  profesor 
en  dos  instituciones  de  dos  anos,  ganan  un  promedio 

de  $64571  por  ano7  con  una  desviacion  estandar  de 
$4000.  En  un  intento  por  verificar  este  nivel  de  salario, 
se  selecciono  una  muestra  de  60  profesores  de  entre  una 
base  de  datos  del  personal  para  todas  las  instituciones  de 
dos  anos  en  Estados  Unidos. 

a.  Describa  la  distribucion  muestral  de  la  media 
muestral  3c. 

b.  (iDentro  de  que  lfmites  se  esperarfa  que  este  el 
promedio  muestral,  con  probabilidad  .95? 

c.  Calcule  la  probabilidad  de  que  la  media  muestral  x  sea 
mayor  a  $66  000. 

d.  Si  su  muestra  aleatoria  en  realidad  produjo  una  media 
muestral  de  $66000,  ^considerarfa  usted  que  esto  es 
poco  comun?  ^Que  conclusion  podrfa  sacar? 

7.27  Error  de  medicion  Cuando  qufmicos 
investigadores  realizan  experimentos,  pueden  obtener 
resultados  ligeramente  diferentes  en  repeticiones 
diferentes,  aunque  el  experimento  sea  realizado  de 
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manera  identica  cada  vez.  Estas  diferencias  se  deben  a  un 
fenomeno  llamado  “error  de  medicion”. 

a.  Haga  una  lista  de  algunas  variables  en  un  experimento 
de  quimica  que  podrfan  causar  algunos  pequenos 
cambios  en  la  medicion  de  la  respuesta  final. 

b.  Si  se  desea  verificar  que  el  error  de  medicion  es 
pequeno,  se  puede  repetir  el  experimento  y  tomar 
el  promedio  muestral  de  todas  las  mediciones.  Para 
reducir  la  cantidad  de  variabilidad  en  el  promedio  de 
mediciones,  -debe  usarse  un  numero  de  repeticiones 
grande  o  pequeno?  Explique. 

7.28  Fomates  Explique  por  que  el  peso  de  un 
empaque  de  una  docena  de  tomates  debe  estar  distribuido 
normalmente  en  forma  aproximada  si  la  docena  de 
tomates  representa  una  muestra  aleatoria. 

7.29  Bacterias  en  el  agua  Use  el  teorema  del  limite 
central  para  explicar  por  que  una  variable  aleatoria  de 
Poisson,  por  ejemplo,  el  numero  de  un  tipo  particular  de 
bacterias  en  un  pie  cubico  de  agua,  tiene  una  distribucion 
que  puede  ser  aproximada  por  una  distribucion  normal 
cuando  la  media  p  es  grande,  (sugerencia:  Un  pie  cubico 
de  agua  contiene  1728  pulgadas  cubicas  de  este  liquido.) 

7.30  Resistencia  del  papel  Un  fabricante  de  papel 
que  se  usa  para  empaque  exige  una  resistencia  minima  de 
20  libras  por  pulgada  cuadrada.  Para  verificar  la  calidad 
del  papel,  cada  hora  se  selecciona  una  muestra  aleato¬ 
ria  de  10  piezas  de  papel  de  entre  la  production  de  la  hora 
previa,  registrandose  la  medicion  de  su  resistencia  para 
cada  una.  La  desviacion  estandar  cr  de  las  mediciones  de 
resistencia,  calculada  al  agrupar  la  suma  de  cuadrados 

de  desviaciones  de  muchas  muestras,  se  sabe  que  es  igual 
a  2  libras  por  pulgada  cuadrada  y  las  mediciones 
de  resistencia  estan  normalmente  distribuidas. 

a.  ('Cual  es  la  distribucion  muestral  aproximada  de  la 
media  muestral  de  n  =  10  piezas  de  papel  de  prueba? 

b.  Si  la  media  de  la  poblacion  de  mediciones  de 
resistencia  es  21  libras  por  pulgada  cuadrada,  /  cual  es 
la  probabilidad  aproximada  de  que,  para  una  muestra 
aleatoria  de  n =  10  piezas  de  papel,  x  <  20? 

c.  ^Que  valor  se  seleccionana  para  la  resistencia  media 
del  papel,  p ,  para  que  P{x  <  20)  sea  igual  a  .001? 

7.31  Miveles  de  potasio  El  requerimiento  normal 
diario  de  potasio  en  seres  humanos  esta  en  el  intervalo  de 
2000  a  6000  miligramos  (mg),  con  cantidades  grandes 
necesarias  durante  los  meses  calurosos  de  verano.  La 
cantidad  de  potasio  en  alimentos  varia,  dependiendo  de 
estos.  Por  ejemplo,  hay  alrededor  de  7  mg  en  un  refresco 
de  cola,  46  mg  en  una  cerveza,  630  mg  en  un  platano 
(banano),  300  mg  en  una  zanahoria  y  440  mg  en  un 
vaso  de  jugo  de  naranja.  Suponga  que  la  distribucion  de 


potasio  en  un  platano  esta  distribuida  normalmente,  con 
media  igual  a  630  mg  y  desviacion  estandar  de  40  mg 
por  platano.  Usted  toma  n  =  3  platanos  al  dia  y  T  es  el 
numero  total  de  miligramos  de  potasio  que  recibe  de  ellos. 

a.  Encuentre  la  media  y  desviacion  estandar  de  T. 

b.  Encuentre  la  probabilidad  de  que  su  ingesta 
diaria  de  potasio  de  los  tres  platanos  exceda  de 

2  000  mg.  (sugerencia:  Observe  que  T  es  la  suma 
de  tres  variables  aleatorias,  jci,  x2  y  x3,  donde  X\  es  la 
cantidad  de  potasio  en  el  platano  1 ,  etcetera.) 

7.32  Venta  de  del#  El  total  de  ventas  diarias  x, 
en  la  section  de  bocadillos  (llamados  delicatessen 
o  deli),  es  la  suma  de  las  ventas  generadas  por  un 
numero  fijo  de  clientes  que  hacen  compras  en  un  dia 
determinado. 

a.  ^Que  clase  de  distribucion  de  probabilidad  se  espera 
que  tenga  el  total  de  ventas  diarias?  Explique. 

b.  Para  este  mercado  particular,  el  promedio  de  venta 
por  cliente  en  la  section  delicatessen  es  $8.50  con 
cr  =  $2.50.  Si  30  clientes  hacen  compras  de  deli  en 
un  dia  determinado,  de  la  media  y  desviacion  estandar 
de  la  distribucion  de  probabilidad  del  total  de  ventas 
diarias, x. 

7.33  Temperaturas  normales  En  el  ejercicio 
1.67,  Allen  Shoemaker  dedujo  una  distribucion  de 
temperaturas  del  cuerpo  humano  con  una  forma  distintiva 
de  monticulo.8  Suponga  que  consideramos  que  las 
temperaturas  de  personas  sanas  es  aproximadamente 
normal,  con  una  media  de  98.6  grados  y  desviacion 
estandar  de  0.8  grados. 

a.  Si  al  azar  se  seleccionan  130  personas  sanas,  ('ciial  es 
la  probabilidad  de  que  la  temperatura  promedio  para 
ellas  sea  de  98.25  grados  o  menor? 

b.  (.Consideraria  usted  que  una  temperatura  promedio  de 
98.25  grados  es  un  suceso  poco  comtin,  dado  que  la 
verdadera  temperatura  promedio  de  personas  sanas  es 
de  98.6  grados?  Explique. 

7.34  Deportes  y  lesiones  del  tendon  de 
Aquiles  Algunos  deportes  en  los  que  se  practica 
una  cantidad  considerable  de  carreras,  saltos  de  altura 
o  de  longitud,  pone  a  los  participantes  en  riesgo  de 
tendinopatia  de  Aquiles  (AT),  que  es  una  inflamacion 
y  engrosamiento  del  tendon  de  Aquiles.  Un  estudio  de 
The  American  Journal  of  Sports  Medicine  observo 

el  diametro  (en  mm)  de  tendones  afectados  y  no 
afectados  de  pacientes  que  participaron  en  estos 
tipos  de  actividades  deportivas.9  Suponga  que  los 
diametros  del  tendon  de  Aquiles  en  la  poblacion  general 
tienen  una  media  de  5.97  milimetros  (mm)  con  una 
desviacion  estandar  de  1 .95  mm. 
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a.  (  C’ual  es  la  probabilidad  de  que  una  muestra 
seleccionada  al  azar  de  3 1  pacientes  produzca  un 
diametro  promedio  de  6.5  mm  o  menos  para  el  tendon 
no  afectado? 

b.  Cuando  los  diametros  del  tendon  afectado  se  midieron 
para  una  muestra  de  3 1  pacientes,  el  diametro 
promedio  fue  9.80.  Si  el  promedio  del  diametro  del 


tendon  en  la  poblacion  de  pacientes  con  AT  no  es 
diferente  del  promedio  del  diametro  de  tendones  no 
afectados  (5.97  mm),  /cual  es  la  probabilidad  de 
observar  un  promedio  de  diametro  de  9.80  o  mayor? 

c.  /Que  conclusiones  podrfan  sacarse  de  los  resultados 
del  inciso  b)? 


LA  DISTRIBUCION  MUESTRAL 
DE  LA  PROPORCION  MUESTRAL 


Hay  numerosos  ejemplos  practicos  de  la  variable  aleatoria  x  binomial.  Una  aplicacion 
conuin  se  relaciona  con  la  preferencia  del  consumidor  o  encuestas  de  opinion,  donde 
usamos  una  muestra  aleatoria  de  n  personas,  para  estimar  la  proporcion  p  de  personas  en 
la  poblacion  que  tienen  una  caracterfstica  especificada.  Si  x  de  las  personas  muestreadas 
tienen  esta  caracterfstica,  entonces  la  proporcion  muestral 


CONSEJO 


P:  /Como  saber  si  es  o  no 
es  binomial?  R:  Vea  si  la 
medicion  tomada  en  una 
sola  unidad  experimental 
de  la  muestra  es  del  tipo 
"exito/fracaso".  Si  es  asf, 
probablemente  es  binomial. 


P  = 


x 

n 


se  puede  usar  para  estimar  la  proporcion  poblacional  p  (figura  7. 12).' 

La  variable  aleatoria  x  binomial  tiene  una  distribucion  de  probabilidad  p(x).  des- 
crita  en  el  capftulo  5,  con  media  rip  y  desviacion  estandar  \Jnpq.  Como  p  es  simple- 

mente  el  valor  de  x,  expresado  como  proporcion  (p  =  —  ],  la  distribucion  muestral  de/3 


\  n ! 

es  identica  a  la  distribucion  de  probabilidad  de  x,  excepto  que  tiene  una  nueva  escala  a 
lo  largo  del  eje  horizontal. 


FIGURA  7.12 

Distribucion  muestral  de 
la  variable  aleatoria  x 
binomial  y  la  proporcion 
muestralp 


-+- 


-+- 


-+- 


-+- 


1/5  2/5  3/5  4/5 


Debido  a  este  cambio  de  escala,  la  media  y  desviacion  estandar  de  p  tambien  tienen 
cambio  de  escala,  de  modo  que  la  media  de  la  distribucion  muestral  de p  es  p,  y  su  error 
estandar  es 

SE (p)  =  donde  q  =  1  —  p 

Por  ultimo,  asf  como  podemos  aproximar  la  distribucion  de  probabilidad  de  x  con  una 
distribucion  normal  cuando  el  tamano  muestral  n  es  grande,  podemos  hacer  lo  mismo 
con  la  distribucion  muestral  de  p. 

'  Un  “sombrero”  puesto  sobre  el  sfmbolo  de  un  parametro  poblacional  denota  una  estadfstica  utilizada  para  estimar 
el  parametro  poblacional.  Por  ejemplo,  el  sfmbolo  p  denota  la  proporcion  muestral. 
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PROPIEDADES  DE  LA  DISTRIBUCION  MUESTRAL 
DE  LA  PROPORCION  MUESTRAL,p 

•  Si  una  muestra  aleatoria  de  n  observaciones  se  selecciona  de  una  poblacion  bino¬ 
mial  con  parametro  p,  entonces  la  distribucion  muestral  de  la  proporcion  mues- 
tral 

a: 

P  =  - 
n 

tendra  una  media 


P 

y  una  desviacion  estandar 
SE (p)  =  V?  donde  q  =  1  —  p 

•  Cuando  el  tamano  muestral  n  es  grande,  la  distribucion  muestral  de p  puede  ser 
aproximada  por  una  distribucion  normal.  La  aproximacion  sera  adecuada  si  np  > 
5  y  nq  >  5. 


En  una  encuesta,  a  500  madres  y  padres  se  les  pregunto  sobre  la  importancia  del  deporte 
para  hijos  e  hijas.  De  los  padres  entrevistados,  60%  estuvieron  de  acuerdo  que  los  gene- 
ros  son  iguales  y  deben  tener  iguales  oportunidades  de  participar  en  deportes.  Describa 
la  distribucion  muestral  de  la  proporcion  muestral  p  de  padres  que  estan  de  acuerdo  en 
que  los  generos  son  iguales  y  deben  tener  iguales  oportunidades. 


Solucion  Se  puede  suponer  que  los  500  padres  representan  una  muestra  aleatoria  de 
los  padres  de  todos  los  hijos  e  hijas  en  Estados  Unidos  y  que  la  verdadera  proporcion 
de  la  poblacion  es  igual  a  algiin  valor  desconocido  que  se  puede  llamar  p.  La  distribu¬ 
cion  muestral  de/3  puede  ser  aproximada  por  una  distribucion  muestral, T  con  media  igual 
a  p  (vease  la  hgura  7.13)  y  error  estandar 

SE  (p)  = 


FIGURA  7.13 

Distribucion  muestral  para 
pbasada  en  una  muestra 
de  n  =  500  padres  para  el 
ejemplo  7.6 


f  Si  se  verifican  las  condiciones  que  permiten  la  aproximacion  normal  a  la  distribucion  de  p.  se  puede  ver  que 
n  =  500  es  adecuado  para  valores  de  p  cercanos  a  .60  porquc p  y  q  son  mayores  que  5. 
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Se  puede  ver  de  la  figura  7.13  que  la  distribution  muestral  de  p  esta  centrada  sobre  su 
media  p.  Aun  cuando  no  se  sabe  el  valor  exacto  de  p  (la  proportion  muestral  p  puede 
ser  mayor  o  menor  de  p),  puede  hallarse  un  valor  aproximado  para  la  desviacion  estan- 
dar  de  la  distribution  muestral  usando  la  proportion  muestral  p  para  aproximar  el  valor 
desconocido  de  p.  Entonces, 

SE  =  #. 


(.60)(3.40) 


500 


=  .022 


Por  tanto,  aproximadamente  95%  del  licmpo,/?  caera  en  no  mas  de  2SE  ~  .044  del  (des- 
conocido)  valor  de  p. 


m 


ENTRENADOR  PERSONAL 

^Corno  calculo  probabilidades  para  la  proporcion 
muestralp? 

1.  Encuentre  los  valores  necesarios  de  n  y  p. 

2.  Verifique  si  la  aproximacion  normal  a  la  distribution  binomial  es  apropiada 
(np  >  5  y  nq  >  5). 

3.  Anote  el  evento  de  interes  en  terminos  de  p  y  localice  el  area  apropiada  en  la 
curva  normal. 

4.  Convierta  los  valores  necesarios  de  p  en  valores  z  usando 


z  =  ■ 


p-  p 


5.  Use  la  tabla  3  del  apendice  I  para  calcular  la  probabilidad. 


Repertorio  de  ejercicios  (Llene  los  espacios  en  bianco) 


A.  Tome  una  muestra  aleatoria  de  tamano  n  =  36  de  una  distribution  binomial  con 

media  p  =  .4.  La  distribution  muestral  de  p  sera  aproximadamente _ 

con  una  media  de _ y  una  desviacion  estandar  (o  error  estandar)  de _ 

B.  Para  hallar  la  probabilidad  de  que  la  proporcion  muestral  exceda  de  .5,  anote  el 

evento  de  interes. _ 

Cuandop  =  .5, 


7  = 


P  zJL  = 

\frn_ 

V  n 


Encuentre  la  probabilidad: 

P(P  > _ )  =  P(z  > _ )  =  1  - 


(continua) 
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C.  Para  hallar  la  probabilidad  de  que  la  proporcion  muestral  sea  entre  .5  y  .6,  anote 

el  evento  de  interes. _ 

Cuandop  =  .5  yp  =  .6, 


z  = 


P  ~_P 

\[pq 

V  n 


Encuentre  la  probabilidad: 

P( _ <p  < _ )  =  P( _ <  z  < _ )  = _ - _ = _ 

Informe  de  progreso 

•  -Today  fa  tiene  problemas?  Trate  de  nuevo  usando  el  Repertorio  de  ejercicios 
del  final  de  esta  section. 

•  ^Ya  domina  la  tabla  z?  Puede  saltarse  el  Repertorio  de  ejercicios  del  final  de 
esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 


E  J  E  M  P  L  O 


Consulte  el  ejemplo  7.6.  Suponga  que  la  proporcion  p  de  padres  en  la  poblacion  es  en 
realidad  igual  a  .55.  ^Cual  es  la  probabilidad  de  observar  una  proporcion  muestral  igual 
de  grande  o  mayor  que  el  valor  observado  p  =  .60? 


La  figura  7.14  muestra  la  distribucion  muestral  de p  cuando  p  =  .55,  con 
el  valor  observado p  =  .60  ubicado  sobre  el  eje  horizontal.  La  probabilidad  de  observar 
una  proporcion  muestral  p  igual  o  mayor  a  .60  es  aproximada  por  el  area  sombreada  en 
la  cola  superior  de  esta  distribucion  normal  con 


p  =  .55 


FIGURA  7.14 

Distribucion  muestral  de 
ppara  n  =  500  y  p  =  .56 
para  el  ejemplo  7.7 


y 

SE  =  \/^  =  \/^P  =  .0222 

V  n  V  500 


Para  hallar  el  area  sombreada,  primero  calcule  el  valor  z  correspondiente  a  p  =  .60: 

-  =  P  ~  p  =  -60  ~  .55  =„r 
\[pqfn  -0222 
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Usando  la  tabla  3  del  apendice  I,  encontramos 

P{p  >  .60)  «  P(z  >  2.25)  =  1  -  .9878  =  .0122 

Esto  es,  si  fueramos  a  seleccionar  una  muestra  aleatoria  de  n  =  500  observaciones  de 
una  poblacion  con  proporcion  p  igual  a  .55,  la  probabilidad  de  que  la  proporcion  mues¬ 
tral  p  serfa  tan  grande  o  mayor  a  .60  es  de  solo  .0122. 


Cuando  la  distribucion  normal  se  utilizo  en  el  capltulo  6  para  aproximar  las  proba- 
bilidades  binomiales  asociadas  con  x,  una  correccion  de  ±.5  se  aplico  para  mejorar 
la  aproximacion.  La  correccion  equivalente  aquf  es  ±(.5 In).  Por  ejemplo,  para/5  =  .60  el 
valor  de  z  con  la  correccion  es 

(.60  -  .001)  -  .55  „  OA 

Z\  —  .  =  —  z.zu 

A /(■ 55X.45) 

V  500 

con  P(p  >  .60)  ~  .0139.  A  una  precision  de  dos  lugares  decimales,  este  valor  concuer- 
da  con  el  resultado  anterior.  Cuando  n  es  grande,  el  efecto  de  usar  la  correccion  es  por  lo 
general  insignificante.  Usted  debe  resolver  problemas  de  este  capitulo  y  los  restantes  sin 
el  factor  de  correccion  a  menos  que  especfficamente  se  le  solicite. 


© 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 
(LLENE  LOS  ESPACIOS  EN  BLANCO) 


Estos  ejercicios  se  ref i ere  n  a  la  seccion  Mi  en  tree  ad  or  personal  de  la  pagina  277. 

7.35  Se  toma  una  muestra  aleatoria  de  tamano  n  =  50  de  una  distribucion  binomial 

con  media  de  p  =  .7.  La  distribucion  muestral  de  p  sera  aproximadamente _ con  una 

media  de _ y  una  desviacion  estandar  (o  error  estandar)  de _ 

7.36  Para  hallar  la  probabilidad  de  que  la  proporcion  muestral  sea  menor  a  .8,  anote  el 

evento  de  interes _ 

Cuando  p  =  .8, 


z  = 


Encuentre  la  probabilidad: 
P{p  < _ )  =  P(z  < 


.)  = 


TECNICAS  BASICAS 

7.37  Muestras  aleatorias  de  tamano  n  se  seleccionaron 
de  poblaciones  binomiales  con  parametros  poblacionales 
p  dados  aquf.  Encuentre  la  media  y  la  desviacion  estandar 
de  la  distribucion  muestral  de  la  proporcion  muestral  p  en 
cada  caso: 

a.  n  =  100,  p  =  .3 

b.  n  =  400,  p  =  .  1 

c.  n  =  250,  p  =  .6 


7.38  (/Es  apropiado  usar  la  distribucion  normal  para 
aproximar  la  distribucion  muestral  de  p  en  las  siguientes 
circunstancias? 

a.  n  =  50,  p  =  .05 

b.  n  =  75,  p  =  .1 

c.  n  =  250,  p  =  .99 
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7.39  Muestras  aleatorias  de  tamano  n  =  75  se 
seleccionaron  de  una  poblacion  binomial  con  p  =  .4. 

Use  la  distribucion  normal  para  aproximar  las  siguientes 
probabilidades: 

a.  P(p  <  .43) 

b.  P(.35  .43) 

7.40  Muestras  aleatorias  de  tamano  n  =  500  se 
seleccionaron  de  una  poblacion  binomial  con  p  =  .  1 . 

a.  /,  Lis  apropiado  usar  la  distribucion  normal  para 
aproximar  la  distribucion  muestral  de/??  Verifique 
para  asegurarse  que  esten  satisfechas  las  condiciones 
necesarias. 

Usando  los  resultados  del  inciso  a),  encuentre  estas 
probabilidades: 

b. p>  .12 

c.  p  <  .10 

d.  p  esta  a  no  mas  de  .02  de  p 

7.41  Calcule  SE(/3)  para  n  =  100  y  estos  valores  de  p: 

a.  p  =  .01  b.  =  .10  c.  p  =  .30 

d .  p  =  .50  e.  p  =  .70  f.  p  =  .90 

g.  p  =  .99 

h.  Grafique  SE(/3)  contra  p  en  papel  de  grafica  y  trace 
una  curva  suave  que  pase  por  los  puntos.  /, Para  que 
valor  de  p  es  maxima  la  desviacion  estandar  de  la 
distribucion  muestral  de  pi  /.Que  ocurre  al  error 
estandar  cuando  p  es  cercano  a  0  o  a  1.0? 

7.42  a.  /.Es  apropiada  la  aproximacion  normal  a  la  dis¬ 

tribucion  muestral  cuando  n  =  400  y  p  =  .8? 

b.  Use  los  resultados  del  inciso  a)  para  hallar  la 
probabilidad  de  que/3  es  mayor  a)  .83. 

c.  Use  los  resultados  del  inciso  a),  para  hallar  la 
probabilidad  de  que/3  esta  entre  .76  y  .84. 

APLICACIONES 

7.43  Jajar  de  peso  Reportajes  en  periodicos  nos 
dicen  que  el  estadounidense  promedio  tiene  sobrepeso. 
Muchos  de  nosotros  hemos  tratado  de  bajar  de  peso 
cuando  terminamos  la  preparatoria  o  la  universidad.  Y, 
en  efecto,  solo  19%  de  adultos  dicen  que  no  sufren  de 
problemas  de  perdida  de  peso.10  Suponga  que  la  cifra 
de  19%  es  correcta  y  que  se  selecciona  una  muestra 
aleatoria  de  n  =  100  adultos. 

a.  La  distribucion  de /?,  es  decir,  la  proporcion  muestral 
de  adultos  que  no  sufren  de  excesos  de  peso,  /. tiene 
una  distribucion  normal  aproximada?  Si  es  asi,  /.cual 
es  su  media  y  desviacion  estandar? 

b.  /Cual  es  la  probabilidad  de  que  la  proporcion  muestral 
p  exceda  de  .25? 


c.  /.Cual  es  la  probabilidad  de  que/3  se  encuentre  dentro 
del  intervalo  .25  a  .30? 

d.  /.Que  se  podrfa  concluir  acerca  de  p  si  la  proporcion 
muestral  excede  de  .30? 

7.44  Costos  de  prescripciones  El  costo  de 
prescripciones  de  patente  se  fija  para  dar  apoyo  a 
investigation  y  desarrollo  de  estos  medicamentos, 
que  pueden  tardar  hasta  20  anos.  Sin  embargo,  una 
mayorfa  de  estadounidenses  dice  que  los  costos  de 
medicamentos  de  patente  (66%),  los  costos  de  hospital 
(64%)  y  visitas  de  medicos  (55%)  son  irracionalmente 
altos.11  Suponga  que  se  toma  una  muestra  aleatoria 

de  n  =  1000  adultos.  Sea/3  la  proporcion  de  adultos 
que  dicen  que  los  precios  de  medicinas  con  receta  son 
irracionalmente  altos. 

a.  /.Cual  es  la  distribucion  exacta  de/3?  /.Como  se  puede 
aproximar  la  distribucion  de/?? 

b.  /.Cual  es  la  probabilidad  de  que/?  exceda  de  .68? 

c.  /.Cual  es  la  probabilidad  de  que/3  se  encuentre  entre 
.64  y  .68? 

d.  /.Un  porcentaje  muestral  de  70%  estarfa  en  contra  del 
valor  reportado  de  66  %? 

7.45  M&M'S  De  acuerdo  con  el  sitio  web  de 
M&M’S,  el  porcentaje  promedio  de  dulces  M&M’S  cafes 
de  un  paquete  de  chocolates  M&M’S  de  leche  es  13%. 12 
(Este  porcentaje  varfa,  no  obstante,  entre  los  diferentes 
tipos  de  los  M&M’S  empacados.)  Suponga  que  al  azar 

se  selecciona  un  paquete  de  chocolates  M&M’S  de  leche 
que  contiene  55  dulces  y  se  determina  la  proporcion  de 
dulces  M&M’S  cafes  del  paquete. 

a.  /.Cual  es  la  distribucion  aproximada  de  la  proporcion 
muestral  de  dulces  M&M’S  cafes  en  un  paquete  que 
contiene  55  dulces? 

b.  /.Cual  es  la  probabilidad  de  que  el  porcentaje  muestral 
de  dulces  cafes  sea  menor  a  20%? 

c.  /.Cual  es  la  probabilidad  de  que  el  porcentaje  muestral 
exceda  de  35%? 

d.  /.Dentro  de  que  intervalo  espera  usted  que  la 
proporcion  muestral  se  encuentre  alrededor  de  95% 
del  tiempo? 

7.46  El  "proyecto  de  ley  de  la  hamburguesa 
con  queso"  En  la  primavera  de  2004,  el  Congreso 
de  Estados  Unidos  considero  un  proyecto  de  ley  que 
impediria  a  estadounidenses  demandaran  a  gigantes  de  la 
comida  rapida  como  McDonald’s  por  hacerles  engordar. 
Aun  cuando  la  industria  de  la  comida  rapida  puede  no  ser 
culpable,  un  estudio  realizado  por  el  Hospital  Infantil 

de  Boston  informa  que  alrededor  de  dos  tercios  de 
adultos  estadounidenses  y  alrededor  de  15%  de  ninos 
y  adolescentes  presentan  sobrepeso.13  Se  selecciono  una 
muestra  aleatoria  de  100  ninos. 
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a.  ('Cual  es  la  probabilidad  de  que  el  porcentaje  muestral 
de  ninos  con  sobrepeso  exceda  de  25 %? 

b.  ('Cual  es  la  probabilidad  de  que  el  porcentaje  muestral 
de  ninos  con  sobrepeso  sea  menor  a  12%? 

c.  ^  Serf  a  poco  comun  hallar  que  30%  de  los  ninos 
muestreados  tuvieran  sobrepeso?  Explique. 

7.47  jAh,  las  nueces!  ^Es  usted  un  “puritano”  del 
chocolate,  o  le  gustan  otros  ingredientes  en  su  chocolate? 
American  Demographics  informa  que  casi  75%  de 
los  consumidores  gustan  de  ingredientes  tradicionales 
como  nueces  o  caramelos  en  su  chocolate.  Son  menos 


entusiastas  hacia  el  gusto  de  la  menta  o  el  cafe,  que  dan 
sabores  mas  distintivos.14  Una  muestra  aleatoria  de  200 
consumidores  se  selecciona  y  se  registra  el  numero  de 
quienes  gustan  de  las  nueces  o  caramelo  en  su  chocolate. 

a.  ('.Cual  es  la  distribucion  muestral  aproximada  para 
la  proporcion  muestral pi  -  Cuales  son  la  media  y 
distribucion  estandar  para  esta  distribucion? 

b.  (iCual  es  la  probabilidad  de  que  el  porcentaje  muestral 
sea  mayor  a  80%  ? 

c.  ^  Dentro  de  que  limites  se  esperarfa  que  la  proporcion 
muestral  se  encuentre  alrededor  de  95%  del  tiempo? 


UNA  APLICACION  MUESTRAL:  CONTROL 
ESTADISTICO  DE  PROCESOS  (OPCIONAL) 

La  metodologfa  del  control  estadfstico  de  procesos  (CEP)  fue  inventada  para  observar, 
controlar  y  mejorar  productos  y  servicios.  Los  cojinetes  de  acero  deben  apegarse  a  espe- 
cificaciones  de  dimensiones  y  dureza,  los  productos  qufmicos  industriales  tienen  un  bajo 
nivel  especificado  de  impurezas  y  las  empresas  de  contadurfa  deben  reducir  al  minirno  y 
finalmente  eliminar  asientos  incorrectos  en  contabilidades.  Con  frecuencia  se  dice  que  el 
control  estadfstico  de  procesos  esta  formado  por  10%  de  estadfstica  y  90%  de  ingenierfa 
y  sentido  comun.  Desde  el  punto  de  vista  estadfstico  podemos  observar  la  media  de  un 
proceso  y  decir  cuando  es  que  la  media  cae  fuera  de  limites  asignados  previamente,  pero 
no  podemos  decir  por  que  esta  fuera  de  control.  Contestar  esta  ultima  pregunta  requiere 
de  conocimiento  del  proceso  y  capacidad  de  resolver  problemas,  es  decir,  el  otro  90%. 

La  calidad  de  un  producto  suele  ser  supervisada  con  el  uso  de  graficas  estadfsticas 
de  control.  Las  mediciones  en  la  variable  de  un  proceso  a  ser  observado  cambian  con 
el  tiempo.  Se  dice  que  la  causa  de  un  cambio  en  la  variable  es  asignable  si  puede  ser 
localizada  y  corregida.  Otra  variacion,  los  pequenos  cambios  fortuitos  debidos  a  la  alte- 
racion  del  ambiente  de  produccion,  que  no  sea  controlable  se  considera  como  variacion 
aleatoria.  Si  la  variacion  en  la  variable  de  un  proceso  es  solo  aleatoria,  se  dice  que  el 
proceso  esta  en  control.  El  primer  objetivo  en  el  control  estadfstico  de  procesos  es  eli¬ 
minar  causas  asignables  de  variacion  en  la  variable  del  proceso  y  luego  poner  el  proceso 
bajo  control.  El  siguiente  paso  es  reducir  la  variacion  y  poner  las  mediciones  en  la  varia¬ 
ble  del  proceso  dentro  de  limites  de  especificacion,  es  decir,  limites  dentro  de  los  cuales 
deben  caer  las  mediciones  sobre  objetos  o  servicios  utilizables. 

Una  vez  que  un  proceso  este  en  control  y  este  produciendo  un  producto  satisfacto- 
rio,  sus  variables  son  supervisadas  con  graficas  de  control.  Se  toman  muestras  de  n 
artfculos  del  proceso  a  intervalos  especificados  y  se  calcula  una  estadfstica  muestral. 
Estas  estadfsticas  se  grafican  en  la  tabla  de  control,  de  modo  que  el  proceso  se  puede 
verificar  respecto  a  cambios  en  la  variable  del  proceso  que  podrfan  indicar  problemas 
de  control. 


Una  grafica  de  control  para  la  media 
del  proceso:  la  grafica  x 

Suponga  que  n  artfculos  se  seleccionan  al  azar  del  proceso  de  produccion  a  interva¬ 
los  iguales  y  que  se  registran  mediciones  en  la  variable  del  proceso.  Si  el  proceso  esta 
en  control,  las  medias  muestrales  deben  variar  alrededor  de  la  media  poblacional  /x 
en  forma  aleatoria.  Ademas,  de  acuerdo  con  el  teorema  del  lfmite  central,  la  distribu- 
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E  J  E  M  P  L 


TABLA  7. 


cion  muestral  de  x  debe  ser  aproximadamente  normal,  de  modo  que  casi  todos  los  valo- 
res  de  x  caen  en  el  intervalo  (/jl  ±  3  SE)  =  /l  ±  3(<r/v'n ).  Aun  cuando  los  valores  exac- 
tos  de  yu,  y  cr  sean  desconocidos,  se  pueden  obtener  esdmaciones  precisas  con  el  uso  de 
mediciones  muestrales. 

Toda  grafica  de  control  tiene  una  line  a  de  centro  y  Umites  de  control.  La  linea  del 
centro  para  la  grafica  3c  es  la  estimacion  de  /jl,  el  gran  promedio  de  todas  las  estadisticas 
muestrales  calculadas  de  las  mediciones  en  la  variable  del  proceso.  Los  Umites  de  con¬ 
trol  superior  e  inferior  estan  colocados  a  tres  desviaciones  estandar  arriba  y  debajo  de  la 
linea  de  centro.  Si  se  observa  la  media  del  proceso  con  base  en  k  muestras  de  tamano  n 
tomadas  a  intervalos  regulares,  la  linea  de  centro  es  x,  el  promedio  de  las  medias  mues¬ 
trales  y  los  limites  de  control  estan  en  3c  ±  3(cr/Vn),  con  crestimada  por  .v,  la  desviacion 
estandar  de  las  mediciones  nk. 

Un  sistema  estadistico  de  observacion  del  control  del  proceso  muestrea  los  diametros 
interiores  de  n  =  4  cojinetes  por  hora.  En  la  tabla  7.6  aparecen  los  datos  para  k  =  25 
muestras  por  hora.  Construya  una  grafica  x  para  vigilar  la  media  del  proceso. 

La  media  muestral  se  calculo  para  cada  una  de  las  k  =  25  muestras.  Por 
ejemplo,  la  media  para  la  muestra  1  es 

_  _  .992  +  1.007  +  1.016  +  .991 

x  —  -  —  1.0015 

4 


25  muestras  por  hora  de  diametros  de  cojinetes, 
n  =  4  cojinetes  por  muestra 

Mediciones  de  Media  muestral, 

Muestra  muestra  x 


1 

.992 

1.007 

1.016 

.991 

1.00150 

2 

1.015 

.984 

.976 

1.000 

.99375 

3 

.988 

.993 

1.011 

.981 

.99325 

4 

.996 

1.020 

1.004 

.999 

1.00475 

5 

1.015 

1.006 

1.002 

1.001 

1.00600 

6 

1.000 

.982 

1.005 

.989 

.99400 

7 

.989 

1.009 

1.019 

.994 

1.00275 

8 

.994 

1.010 

1.009 

.990 

1.00075 

9 

1.018 

1.016 

.990 

1.011 

1.00875 

10 

.997 

1.005 

.989 

1.001 

.99800 

11 

1.020 

.986 

1.002 

.989 

.99925 

12 

1.007 

.986 

.981 

.995 

.99225 

13 

1.016 

1.002 

1.010 

.999 

1.00675 

14 

.982 

.995 

1.011 

.987 

.99375 

15 

1.001 

1.000 

.983 

1.002 

.99650 

16 

.992 

1.008 

1.001 

.996 

.99925 

17 

1.020 

.988 

1.015 

.986 

1.00225 

18 

.993 

.987 

1.006 

1.001 

.99675 

19 

.978 

1.006 

1.002 

.982 

.99200 

20 

.984 

1.009 

.983 

.986 

.99050 

21 

.990 

1.012 

1.010 

1.007 

1.00475 

22 

1.015 

.983 

1.003 

.989 

.99750 

23 

.983 

.990 

.997 

1.002 

.99300 

24 

1.011 

1.012 

.991 

1.008 

1.00550 

25 

.987 

.987 

1.007 

.995 

.99400 

Las  medias  muestrales  se  ven  en  la  ultima  columna  de  la  tabla  7.6.  La  linea  del  centro 
esta  situada  en  el  promedio  de  las  medias  muestrales,  o  sea 


=  24.9675 

25 


=  .9987 
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Grafica  MINITAB  x  para  el 
ejemplo  7.8 
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El  valor  calculado  de  s,  la  desviacion  muestral  estandar  de  todas  las  nk  =  4(25)  =  100 
observaciones,  es  s  =  .01 1458  y  el  error  estandar  estimado  de  la  media  de  n  =  4  obser- 
vaciones  es 


s 

Vn 


.011458 

V4 


=  .005729 


Los  llmites  de  control  superior  e  inferior  se  encuentran  como 


UCL  =  x  +  3~t=  =  .9987  +  3(.005729)  =  1.015887 
V  n 


y 


LCL  =x-  3^=  =  .9987  -  3(.005729)  =  .981513 

La  figura  7.15  muestra  una  salida  impresa  MINITAB  de  la  grafica  x  construida  a  partir  de 
los  datos.  Si  se  supone  que  las  muestras  empleadas  para  construir  la  grafica  x  se  recolec- 
taron  cuando  el  proceso  estaba  en  control,  la  grafica  se  puede  usar  ahora  para  detectar 
cambios  en  la  media  del  proceso.  Las  medias  muestrales  se  grafican  periodic amente  y,  si 
una  media  muestral  cae  fuera  de  los  lfmites  de  control,  debe  comunicarse  una  adverten- 
cia.  El  proceso  debe  verificarse  para  localizar  la  causa  de  la  media  anormalmente  grande 
o  pequena. 


Una  grafica  de  control  para  la  proporcion 
de  piezas  defectuosas:  la  grafica  p 

A  veces  la  observation  hecha  en  un  artfculo  es  simplemente  para  saber  si  satisface  o  no 
las  especificaciones;  entonces,  se  juzga  como  defectuosa  o  no  defectuosa.  Si  la  fraccion 
de  piezas  defectuosas  producidas  por  el  proceso  es  p,  entonces  x,  el  numero  de  defectuo¬ 
sas  en  una  muestra  de  n  arttculos,  tiene  una  distribution  binomial. 

Para  supervisar  un  proceso  para  ver  si  hay  arttculos  defectuosos,  se  seleccionan  mues¬ 
tras  de  tamano  n  a  intervalos  periodicos  y  se  calcula  la  proporcion  muestral p.  Cuando  el 
proceso  esta  en  control,/?  debe  caer  en  el  intervalo  p  ±  3SE.  donde  p  es  la  proporcion  de 
defectuosas  en  la  poblacion  (o  la  fraccion  defectuosa  del  proceso)  con  error  estandar 


SE 


\[E1  =  \  jp c1  ~p) 

y  n  V  n 
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La  fraction  defectuosa  del  proceso  es  desconocida  pero  puede  calcularse  por  el  prome- 
dio  de  las  proporciones  muestrales  k : 


y  el  error  estandar  es  estimado  por 

se 

La  linea  de  centro  para  la  grafica  p  esta  ubicado  en  p,  y  los  limites  de  control  superior 
e  inferior  son 


ucl  =p  +  3  V7-^r-- 


LCL  =  p-  3 


P(  1  ~P) 


EJEMPLO 


Un  fabricante  de  boligrafos  muestrea  al  azar  400  boligrafos  por  dia  y  prueba  cada  uno  de 
ellos  para  ver  si  el  flujo  de  tinta  es  aceptable.  Las  proporciones  de  boligrafos  juzgados 
como  defectuosos  por  dia,  en  un  periodo  de  40  dias,  se  ven  en  la  tabla  7.7.  Construya  una 
grafica  de  control  para  la  proporcion  p  de  muestras  defectuosas  en  n  =  400  boligrafos 
seleccionados  del  proceso. 


TABLA  7.7  Proporciones  de  muestras  defectuosas  en  n  =  400  boligrafos 


Dia 

Proporcion 

Dia 

Proporcion 

Dia 

Proporcion 

Dia 

Proporcion 

1 

.0200 

11 

.0100 

21 

.0300 

31 

.0225 

2 

.0125 

12 

.0175 

22 

.0200 

32 

.0175 

3 

.0225 

13 

.0250 

23 

.0125 

33 

.0225 

4 

.0100 

14 

.0175 

24 

.0175 

34 

.0100 

5 

.0150 

15 

.0275 

25 

.0225 

35 

.0125 

6 

.0200 

16 

.0200 

26 

.0150 

36 

.0300 

7 

.0275 

17 

.0225 

27 

.0200 

37 

.0200 

8 

.0175 

18 

.0100 

28 

.0250 

38 

.0150 

9 

.0200 

19 

.0175 

29 

.0150 

39 

.0150 

10 

.0250 

20 

.0200 

30 

.0175 

40 

.0225 

Solucion  La  estimation  de  la  proporcion  de  piezas  defectuosas  del  proceso  es  el 
promedio  de  las  k  =  40  proporciones  muestrales  de  la  tabla  7.7.  Por  tanto,  la  linea 
del  centro  de  la  grafica  de  control  esta  ubicada  en 

-  ?Pi  _  .0200  +  .0125  +  •  •  •  +  .0225  .7600  _  n|0 

'  k  40  40 

Una  estimation  del  SE,  es  decir  el  error  estandar  de  las  proporciones  muestrales,  es 
=  =  «  3 

y  3SE  =  (3)(. 00683)  =  .0205.  Por  tanto,  los  limites  de  control  superior  e  inferior  para 
la  grafica  p  estan  ubicados  en 

limite  superior  de  control  =  p  +  3SE  =  .0190  +  .0205  =  .0395 


y 

limite  inferior  de  control  =p~  3SE  =  .0190  —  .0205  =  —.0015 
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O  bien,  como  p  no  puede  ser  negativa,  el  limite  inferior  de  control  o  LCL  =  0. 

La  grafica  de  control  p  se  muestra  en  la  figura  7.16.  Observe  que  las  40  proporciones 
muestrales  caen  dentro  de  los  limites  de  control.  Si  una  proporcion  muestral  recolectada 
en  algun  tiempo  futuro  cae  fuera  de  los  limites  de  control,  el  fabricante  debe  ocuparse 
de  un  aumento  en  el  porcentaje  de  piezas  defectuosas,  ademas  de  tomar  las  medidas 
necesarias  para  buscar  las  posibles  causas  de  este  aumento. 


Otras  graficas  de  control  que  por  lo  general  se  utilizan  son  la  grafica  R.  que  se  usa 
para  vigilar  la  variacion  de  la  variable  del  proceso  por  medio  del  intervalo  muestral  y  la 
grafica  c,  que  se  usa  para  vigilar  el  numero  de  defectos  por  pieza. 


0 


EJERCICIOS 


TECNICAS  BASICAS 


7.48  Las  medias  muestrales  se  calcularon  para  30 
muestras  de  tamano  n  =  10  para  un  proceso  que  se  juzgo 
en  control.  Las  medias  de  los  30  valores  x  y  la  desviacion 
estandar  de  las  300  mediciones  combinadas  fueron 

x  =  20.74  y  s  =  .87,  respectivamente. 

a.  Use  los  datos  para  determinar  los  limites  superior  e 
inferior  de  control  para  una  grafica  3c. 

b.  ('Cual  es  el  proposito  de  una  grafica  x? 

c.  Construya  una  grafica  3c  para  el  proceso  y  explique 
como  se  puede  usar. 

7.49  Las  medias  muestrales  se  calcularon  para  40 
muestras  de  tamano  n  =  5  para  un  proceso  que  se  juzgo 
en  control.  Las  medias  de  los  40  valores  y  la  desviacion 
estandar  de  las  200  mediciones  combinadas  fueron 

x  =  155.9  y  s  =  4.3,  respectivamente. 

a.  Use  los  datos  para  determinar  los  limites  superior  e 
inferior  de  control  para  una  grafica  x. 

b.  Construya  una  grafica  3c  para  el  proceso  y  explique 
como  se  puede  usar. 


7.50  Explique  la  diferencia  entre  una  grafica  x  y  una 
grafica  p. 

7.51  Muestras  de  n  =  100  articulos  se  seleccionaron 
cada  hora  durante  un  periodo  de  100  horas  y  la 
proporcion  muestral  de  defectuosas  se  calculo  cada  hora. 
La  media  de  las  100  proporciones  muestrales  fue  de  .035. 

a.  Use  los  datos  para  determinar  los  limites  superior  e 
inferior  de  control  para  una  grafica  p. 

b.  Construya  una  grafica  p  para  el  proceso  y  explique 
como  se  puede  usar. 

7.52  Muestras  de  n  =  200  articulos  se  seleccionaron 
cada  hora  durante  un  periodo  de  100  horas  y  la 
proporcion  muestral  de  defectuosas  se  calculo  cada  hora. 
La  media  de  las  100  proporciones  muestrales  fue  de  .041. 

a.  Use  los  datos  para  determinar  los  limites  superior  e 
inferior  de  control  para  una  grafica  p. 

b.  Construya  una  grafica  p  para  el  proceso  y  explique 
como  se  puede  usar. 
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APLICACIONES 

7.53  Veintiuno  Un  casino  de  juegos  de  azar  registra 
y  grafica  la  ganancia  o  perdida  diaria  media,  de  cinco 
mesas  de  veintiuno,  en  una  grafica  3c.  La  media  general 
de  las  medias  muestrales  y  la  desviacion  estandar  de  los 
datos  combinados  de  40  semanas  fueron  3c  =  $10752  y 
s  =  $1 605,  respectivamente. 

a.  Construya  una  grafica  3c  para  la  ganancia  diaria  media 
por  mesa  de  veintiuno. 

b.  ^Como  puede  ser  de  valor  esta  grafica  3c  al  gerente  del 
casino? 

7.54  Remaches  de  laton  Un  fabricante  de  remaches 
de  laton  muestrea  al  azar  400  remaches  cada  hora  y 
calcula  la  proporcion  de  los  defectuosos  de  la  muestra. 

La  proporcion  media  muestral  calculada  de  200  muestras 
era  igual  a  .021.  Construya  una  grafica  de  control  para  la 
proporcion  de  defectuosos  en  muestras  de  400  remaches. 
Explique  la  forma  en  que  la  grafica  de  control  puede  ser 
de  valor  para  un  gerente. 

(^)datos  7.55  Especificaciones  en  madera  El 

gerente  de  una  compafua  de  materiales  de 
construccion  muestrea  al  azar  la  madera  que  recibe 
para  ver  si  cumple  con  especificaciones  de  calidad.  De 
cada  embarque,  100  piezas  de  madera  de  2  X  4  son 
inspeccionadas  y  juzgadas  de  acuerdo  a  si  son  de  primera 
(aceptable)  o  de  segunda  (defectuosa)  clase.  Las 
proporciones  de  piezas  de  madera  de  2  X  4  de  segunda 
registradas  para  30  embarques  fueron  como  sigue: 


.14 

.21 

.19 

.18 

.23 

.20 

.25 

.19 

.22 

.17 

.21 

.15 

.23 

.12 

.19 

.22 

.15 

.26 

.22 

.21 

.14 

.20 

.18 

.22 

.21 

.13 

.20 

.23 

.19 

.26 

Construya  una  grafica  de  control  para  la  proporcion  de 
piezas  de  madera  de  2  X  4  en  muestras  de  100  piezas 
de  madera.  Explique  la  forma  en  que  la  grafica  de  control 
puede  ser  empleada  por  el  gerente  de  la  compafua  de 
materiales  de  construccion. 

7.56  Planta  generadora  de  electricidad  a  base  de 
carbon  Una  planta  generadora  de  electricidad  a  base  de 
carbon  prueba  y  mide  tres  especfmenes  de  carbon  al  dfa, 
para  vigilar  el  porcentaje  de  ceniza  en  el  carbon.  La  media 
general  de  30  medias  muestrales  diarias  y  la  desviacion 
estandar  combinada  de  todos  los  datos  fueron  3c  =  7.24 
y  s  =  .07,  respectivamente.  Construya  una  grafica  x  para 
el  proceso  y  explique  la  forma  en  que  puede  ser  de  valor 
para  el  gerente  de  la  planta  generadora  de  electricidad. 

datos  7.57  Planta  nuclear  de  energia 

eiectric.  Los  datos  de  la  tabla  son  medidas 
de  la  radiacion  en  partfculas  de  aire  en  una  planta 
nuclear  de  energia  electrica.  Cuatro  mediciones  se 
registraron  a  intervalos  semanales  en  un  periodo  de  26 


semanas.  Use  los  datos  para  construir  una  grafica  3c  y 
grafique  los  26  valores  de  3c.  Explique  la  forma  en  que  se 
puede  usar  la  grafica. 

Semana  Radiacion 


1 

.031 

.032 

.030 

.031 

2 

.025 

.026 

.025 

.025 

3 

.029 

.029 

.031 

.030 

4 

.035 

.037 

.034 

.035 

5 

.022 

.024 

.022 

.023 

6 

.030 

.029 

.030 

.030 

7 

.019 

.019 

.018 

.019 

8 

.027 

.028 

.028 

.028 

9 

.034 

.032 

.033 

.033 

10 

.017 

.016 

.018 

.018 

11 

.022 

.020 

.020 

.021 

12 

.016 

.018 

.017 

.017 

13 

.015 

.017 

.018 

.017 

14 

.029 

.028 

.029 

.029 

15 

.031 

.029 

.030 

.031 

16 

.014 

.016 

.016 

.017 

17 

.019 

.019 

.021 

.020 

18 

.024 

.024 

.024 

.025 

19 

.029 

.027 

.028 

.028 

20 

.032 

.030 

.031 

.030 

21 

.041 

.042 

.038 

.039 

22 

.034 

.036 

.036 

.035 

23 

.021 

.022 

.024 

.022 

24 

.029 

.029 

.030 

.029 

25 

.016 

.017 

.017 

.016 

26 

.020 

.021 

.020 

.022 

7.58  Bates  de  beisbol  Una  planta  fabricante  de 
maderas  duras  tiene  varias  lfneas  de  production  diferentes 
para  hacer  bates  de  beisbol  de  diferentes  pesos.  Una 

de  esas  lfneas  de  production  esta  disenada  para  producir 
bates  que  pesan  32  onzas.  Durante  un  tiempo,  cuando 
se  sabe  que  el  proceso  de  production  esta  en  control 
estadfstico,  el  peso  promedio  de  un  bate  se  encontro  que 
era  de  31.7  onzas.  Los  datos  observados  se  reunieron  de  50 
muestras,  cada  una  de  ellas  formada  de  5  mediciones.  Se 
encontro  que  la  desviacion  estandar  de  todas  las  muestras 
era  s  =  .2064  onzas.  Construya  una  grafica  3c  para  vigilar  el 
proceso  de  production  de  bates  de  32  onzas. 

7.59  Mas  bates  de  beisbol  Consulte  el  ejercicio 
7.58  y  suponga  que,  durante  un  dfa  cuando  el 
estado  del  proceso  de  production  de  bates  de  32  onzas 
era  desconocido,  se  obtuvieron  las  siguientes  mediciones 
a  intervalos  de  una  hora. 

Hora  x  Hora  x 

1  31.6  4  33.1 

2  32.5  5  31.6 

3  33.4  6  31.8 

Cada  medicion  representa  una  estadfstica  calculada  de  una 
muestra  de  cinco  pesos  de  bates  seleccionados  del  proceso 
de  production  durante  cierta  hora.  Use  la  grafica  de  control 
construida  en  el  ejercicio  7.58  para  supervisar  el  proceso. 
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REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Planes  muestrales  y  disenos 
experimentales 

1 .  Muestreo  aleatorio  simple 

a.  Cada  posible  muestra  de  tamano  n  es  igual- 
mente  probable  de  ocurrir. 

b.  Use  una  computadora  o  tabla  de  numeros  alea- 
torios. 

c.  Los  problemas  son:  sin  respuesta,  baja  cober- 
tura  y  sesgo  verbal. 

2.  Otros  planes  muestrales  con  aleatorizacion 

a.  Muestreo  aleatorio  estratificado 

b.  Muestreo  de  conglomerado 

c.  Muestreo  sistematico  de  I  en  k 

3.  Muestreo  no  aleatorio 

a.  Muestreo  de  conveniencia 

b.  Muestreo  de  juicio 

c.  Muestreo  de  cuota 

II.  Estadlsticas  y  distribuciones 
muestrales 

1 .  Las  distribuciones  muestrales  describen  los  posi- 
bles  valores  de  una  estadfstica  y  con  que  frecuen- 
cia  se  presentan  en  muestreo  repetido. 

2.  Las  distribuciones  muestrales  se  pueden  deducir 
matematicamente,  aproximarse  en  forma  empfrica 
o  hallarse  usando  teoremas  estadfsticos. 

3.  El  teorema  del  li'mite  central  dice  que  las  sumas 
y  promedios  de  mediciones  de  una  poblacion  no 
normal,  con  media  p,  finita  y  desviacion  estandar 
cr,  tienen  distribuciones  aproximadamente  norma- 
les  para  muestras  grandes  de  tamano  n. 

III.  Distribucion  muestral  de  la  media 
muestral 

1 .  Cuando  muestras  de  tamano  n  se  sacan  al  azar  de 
una  poblacion  normal  con  media  pi  y  varianza  cr2, 
la  media  muestral  x  tiene  una  distribucion  normal 
con  media  pi  y  desviacion  estandar  a/Vn. 

2.  Cuando  muestras  de  tamano  k  se  sacan  al  azar  de 
una  poblacion  no  normal  con  media  pi  y  varianza 
cr2,  el  teorema  del  lfmite  central  asegura  que  la 
media  muestral  v  tendra  una  distribucion  aproxi¬ 
madamente  normal  con  media  pi  y  desviacion 
estandar  a/Vn  cuando  n  es  grande  (n  >  30). 


3.  Las  probabilidades  que  contengan  la  media  mues¬ 
tral  pueden  calcularse  al  estandarizar  el  valor  de  x 
usando  z: 

_  x  —  pi 
a/Vn 

IV.  Distribucion  muestral 

de  la  proporcion  muestral 

1 .  Cuando  muestras  de  tamano  n  se  toman  de  una 
poblacion  binomial  con  parametro  p,  la  propor¬ 
cion  muestral  p  tendra  una  distribucion  aproxi¬ 
madamente  normal  con  media  p  y  desviacion 
estandar  \jpq/n  mientras  np  >  5  y  nq  >  5. 

2.  Las  probabilidades  que  comprendan  la  proporcion 
muestral  se  pueden  calcular  al  estandarizar  el 
valor p  usando  z: 


V.  Control  estadfstico  de  un  proceso 

1 .  Para  vigilar  un  proceso  cuantitativo,  use  una 
grafica  x.  Seleccione  k  muestras  de  tamano  n  y 
calcule  la  media  general  x  y  la  desviacion  estan¬ 
dar  .v  de  todas  las  nk  mediciones.  Genere  lfmites 
de  control  superiores  e  inferiores  como 


Si  una  media  muestral  excede  de  estos  lfmites,  el 
proceso  esta  fuera  de  control. 

2.  Para  vigilar  un  proceso  binomial,  use  una  grafica 
p.  Seleccione  k  muestras  de  tamano  n  y  calcule  el 
promedio  de  las  proporciones  muestrales  como 


Genere  lfmites  de  control  superiores  e  inferiores 
como 

-p±^EsifIi 

Si  una  proporcion  muestral  excede  de  estos  lfmi¬ 
tes,  el  proceso  esta  fuera  de  control. 
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El  teorema  del  Ifmite  central  en  operacion 


El  MINITAB  es  una  herramienta  perfecta  para  explorar  la  forma  en  que  el  teorema  del 
Ifmite  central  funciona  en  la  practica.  Recuerde  que,  segun  el  teorema  del  Ifmite  central, 
si  muestras  aleatorias  de  tamano  n  se  sacan  de  una  poblacion  no  normal  con  media  fi 
y  desviacion  estandar  cr,  entonces  cuando  n  es  grande,  la  distribucion  muestral  de  la 
media  muestral  x  sera  aproximadamente  normal  con  la  misma  media  /jl  y  con  error  es¬ 
tandar  a/Vn.  Intentemos  muestrear  a  partir  de  una  poblacion  no  normal  con  la  ayuda 
del  MINITAB. 

En  una  hoja  de  trabajo  MINITAB nueva,  genere  100  muestras  de  tamano  n  =  30  de  una 
distribucion  no  normal  llamada  distribucion  exponencial.  Use  Calc  — >  Random  Data 
— »  Exponential.  Teclee  100  para  el  numero  de  renglones  de  datos  y  guarde  los  resulta- 
dos  en  C1-C30  (vease  la  figura  7.17).  Deje  la  media  en  el  valor  predeterminado  de  1.0,  el 
umbral  en  0.0  y  de  un  clic  en  OK.  Los  datos  se  generan  y  guardan  en  la  hoja  de  trabajo. 
Use  Graph  — >  Histogram  — >  Simple  para  ver  la  distribucion  de  algunos  de  los  datos, 
por  ejemplo  Cl  (como  en  la  figura  7.18).  Observe  que  la  distribucion  no  tiene  forma  de 
montfculo;  esta  sumamente  sesgada  a  la  derecha. 

FIGURA  7.1  7 


Para  la  distribucion  exponencial  que  hemos  empleado,  la  media  y  desviacion  estandar 
son  /jl  =  1  y  cr  =  1,  respectivamente.  Verifique  las  estadfsticas  descriptivas  para  una  de 
las  columnas  (use  Stat  — »  Basic  Statistics  — »  Display  Descriptive  Statistics)  y  se  vera 
que  las  100  observaciones  tienen  una  media  muestral  y  desviacion  estandar  que  son  cer- 
canas  pero  no  exactamente  iguales  a  1 .  A  continuacion,  genere  100  valores  de  x  con  base 
en  muestras  de  tamano  n  =  30  al  crear  una  columna  de  medias  para  los  100  renglones. 
Use  Calc  —>  Row  Statistics  y  seleccione  Mean.  Para  promediar  las  entradas  en  todas  las 
30  columnas,  seleccione  o  teclee  C1-C30  en  la  caja  de  variables  de  Entrada  y  guarde  los 
resultados  en  C31  (vease  la  figura  7.19).  Ahora  podra  ver  la  distribucion  de  las  medias 
muestrales  usando  Graph  —>  Histogram  — >  Simple,  seleccionando  C31  y  dando  un  clic 
en  OK.  La  distribucion  de  las  100  medias  muestrales  generadas  para  nuestro  ejemplo  se 
ilustran  en  la  figura  7.20. 
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FIGURA  7.18 


FIGURA  7.19 
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FIGURA  7.20 


3:  Hiilogram  of  C31 


Observe  la  distintiva  forma  de  monticulo  de  la  distribucion  de  la  figura  7.20  en  com- 
paracion  con  la  distribucion  original  de  la  figura  7.18.  Tambien,  si  verifica  las  estadisti- 
cas  descriptivas  para  C31,  encontrara  que  la  media  y  desviacion  estandar  de  nuestras  100 
medias  muestrales  no  son  demasiado  diferentes  de  los  valores  teoricos,  /x  =  I  y  a/Vn  = 
1A/30  =.18.  (Para  nuestros  datos,  la  media  muestral  es  .9645  y  la  desviacion  estandar 
es  .1875.)  Como  solo  temamos  100  muestras,  nuestros  resultados  no  son  exactamente 
iguales  a  los  valores  teoricos.  Si  hubieramos  generado  un  numero  infinito  de  muestras, 
hubieramos  obtenido  una  cantidad  exacta.  jEste  es  el  teorema  del  limite  central  en  ope- 
racion! 


EJercicios  suplementarios 

7.60  Una  poblacion  finita  consta  de  cuatro  elementos: 

6,  1,3,2. 

a.  ^Cuantas  muestras  diferentes  de  tamano  n  =  2  se 
pueden  seleccionar  de  esta  poblacion  si  se  muestrea 
sin  reemplazo?  (El  muestreo  se  dice  que  es  sin 
reemplazo  si  un  elemento  no  puede  ser  seleccionado 
dos  veces  para  la  misma  muestra.) 

b.  Haga  una  lista  de  posibles  muestras  de  tamano  n  =  2. 

c.  Calcule  la  media  muestral  para  cada  una  de  las 
muestras  dadas  en  el  inciso  b). 

d.  Encuentre  la  distribucion  muestral  de  x.  Use 
un  histograma  de  probabilidad  para  graficar  la 
distribucion  muestral  de  x. 

e.  Si  los  cuatro  valores  poblacionales  son  igualmente 
probables,  calcule  el  valor  de  la  media  poblacional  /x. 


(',Alguna  de  las  muestras  de  la  lista  del  inciso 
b)  producen  un  valor  de  x  exactamente  igual 
a  /x? 

7.61  Consulte  el  ejercicio  7.60.  Encuentre  la 
distribucion  muestral  para  x  si  muestras  aleatorias  de 
tamano  n  =  3  se  seleccionan  sin  reemplazo.  Grafique  la 
distribucion  muestral  de  x. 

7.62  fubos  deplomo  Estudios  realizados  indican 
que  el  agua  potable,  suministrada  por  algunos  viejos 
sistemas  de  tuberfas  con  forro  interior  de  plomo 
(canerfas)  en  las  ciudades,  puede  contener  niveles 
peligrosos  de  plomo.  Un  estudio  importante  del 
sistema  de  abastecimiento  de  agua  de  Boston  mostro 
que  la  distribucion  de  lecturas  de  contenido  de  plomo 
para  muestras  individuales  de  agua  tenia  una  media 
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y  desviacion  estandar  de  aproximadamente  .033 
miligramos  por  litro  (mg/1)  y  .10  mg/1,  respectivamente.15 

a.  Explique  por  que  piensa  usted  que  esta  distribucion 
esta  o  no  esta  normalmente  distribuida. 

b.  Debido  a  que  los  investigadores  estan  preocupados 
por  la  forma  de  la  distribucion  del  inciso  a),  calcularon 
el  promedio  de  los  niveles  diarios  de  plomo  en  40 
lugares  de  cada  uno  de  los  23  dias  seleccionados  al 
azar.  (iQue  se  puede  decir  acerca  de  la  forma  de  la 
distribucion  del  promedio  de  niveles  diarios  de  plomo 
de  los  que  se  tomo  la  muestra  de  23  dias? 

c.  (:Cuales  son  la  media  y  desviacion  estandar  de  la 
distribucion  del  promedio  de  niveles  de  plomo  en  el 
inciso  b)? 

7.63  Biomasa  La  cantidad  total  de  vegetacion  presente 
en  los  bosques  de  nuestro  planeta  es  importante  para 
ecologistas  y  politicos,  porque  las  plantas  verdes  absorben 
bioxido  de  carbono.  Una  evaluation  demasiado  baja  de 

la  masa  vegetativa  de  la  Tierra,  o  biomasa,  significa  que 
gran  parte  del  bioxido  de  carbono  emitido  por  la  actividad 
humana  (principalmente  por  la  quema  de  combustibles 
fosiles)  no  sera  absorbido  y  ocurrira  un  aumento  de 
bioxido  de  carbono  que  producira  alteration  del  clima. 
Estudios  realizados16  indican  que  la  biomasa  para  bosques 
tropicales,  estimada  en  unos  35  kilogramos  por  metro 
cuadrado  (kg/m2),  puede  en  realidad  ser  demasiado  alta  y 
que  los  valores  de  biomasa  tropical  varian  de  una  region  a 
otra  de  alrededor  de  5  a  55  kg/m2.  Supongamos  que  usted 
mide  la  biomasa  tropical  en  400  lugares  seleccionados  al 
azar,  de  un  metro  cuadrado  cada  uno. 

a.  Aproxime  cr,  la  desviacion  estandar  de  las  mediciones 
de  biomasa. 

b.  ('  Cual  es  la  probabilidad  de  que  el  promedio  muestral 
se  encuentre  dentro  de  dos  unidades  del  verdadero 
promedio  de  biomasa  tropical? 

c.  Si  el  promedio  muestral  obtenido  es  x  =  31.75,  <,que 
concluirfa  usted  acerca  de  la  estimation  excesiva 
que  preocupa  a  cientificos? 

7.64  Cascos  de  proteccion  Los  requisitos  de 
seguridad  para  cascos  de  proteccion  utilizados  por 
trabajadores  de  la  construction  y  otros,  establecidos 
por  el  American  National  Standards  Institute  (ANSI), 
especifican  que  cada  uno  de  tres  cascos  pase  la  siguiente 
prueba.  Se  coloca  un  casco  sobre  una  forma  de  cabeza 
de  aluminio.  Se  deja  caer  una  esfera  de  acero  de 

8  libras  de  peso  sobre  el  casco  desde  una  altura  de  5 
pies  y  se  mide  la  fuerza  resultante  en  la  parte  inferior  de 
la  forma  de  cabeza.  La  fuerza  ejercida  en  la  forma  de 
cabeza  por  cada  uno  de  los  tres  cascos  debe  ser  menor  a 
1000  libras  y  el  promedio  de  los  tres  debe  ser  menor 
a  850  libras.  (Se  desconoce  la  relation  entre  esta  prueba 


y  el  dano  real  a  una  cabeza  humana.)  Suponga  que  la 
fuerza  ejercida  esta  normalmente  distribuida  y  por  tanto 
la  media  muestral  de  tres  mediciones  de  la  fuerza  esta 
normalmente  distribuida.  Si  una  muestra  aleatoria  de  tres 
cascos  se  selecciona  de  un  envio  con  una  media  igual  a 
900  y  cr  =  100,  (:,cual  es  la  probabilidad  de  que  la  media 
muestral  satisfaga  la  norma  del  ANSI? 

7.65  Imageries  y  memoria  Un  psicologo 
investigador  esta  planeando  un  experimento  para 
determinar  si  el  uso  de  imagenes,  es  decir  describir 
una  palabra  en  la  mente,  afecta  la  capacidad  de  las 
personas  para  aprender  de  memoria  algo.  El  investigador 
desea  usar  dos  grupos  de  sujetos:  un  grupo  que  memoriza 
un  conjunto  de  20  palabras  usando  la  tecnica  de  imagenes 
y  un  grupo  que  no  usa  imagenes. 

a.  Use  una  tecnica  de  aleatorizacion  para  dividir  un 
grupo  de  20  individuos  en  dos  grupos  de  igual  tamano. 

b.  (:,C6mo  puede  el  investigador  seleccionar  al  azar  el 
grupo  de  20  individuos? 

c.  Suponga  que  el  investigador  ofrece  pagar  $50  a 
cada  participante  del  experimento  y  utiliza  a  los 
primeros  20  estudiantes  que  lo  solicitan.  ^Este  grupo 
se  comportarfa  como  si  fuera  una  muestra  aleatoria 
simple  de  tamano  n  =  20? 

7.66  Abortos  legales  Los  resultados  de  una  encuesta 
del  Newsweek  respecto  a  puntos  de  vista  sobre  el  aborto, 
dados  en  la  tabla  que  sigue,  muestran  que  no  hay 
consenso  sobre  este  asunto  entre  los  estadounidenses.17 

Encuesta  del  Newsweek  realizada  por  Princeton  Survey 
Research  Associates  International.  Oct.  26-27,  2006.  N  =  1002 
adultos  en  todo  el  pais.  MoE  ±  3  (para  todos  los  adultos). 

“^Con  cual  lado  del  debate  politico  sobre  el  problema  del  aborto 
simpatiza  usted  mas:  el  movimiento  del  derecho  a  la  vida  que 
cree  que  el  aborto  es  quitar  la  vida  y  debe  ser  proscrito;  O 
BIEN,  el  movimiento  a  favor  de  eleccion  libre  que  piensa  que 
una  mujer  tiene  el  derecho  a  escoger  que  hacer  con  su  cuerpo, 
incluyendo  decidir  tener  un  aborto?”  (Opciones  altemadas) 


Eleccion  No  esta 


Derecho  a 
la  vida  % 

libre 

% 

Ninguno 

% 

seguro 

% 

Todos  los  adultos 

39 

53 

3 

5 

Republicanos 

62 

31 

4 

3 

Democratas 

25 

69 

2 

4 

Independientes 

35 

57 

4 

4 

a.  (',Es  este  un  estudio  de  observation  o  un  experimento 
planeado? 

b.  ((Hay  posibilidad  de  problemas  en  respuestas  que 
surgen  por  la  naturaleza  un  tanto  sensible  del  tema? 

(■  Que  clases  de  sesgos  podrian  ocurrir? 

7.67  Rabanos  que  brotan  Un  experimento  de 
biologia  se  diseno  para  determinar  si  las  semillas 
nacientes  de  rabanos  inhiben  la  germinacion  de  semillas 
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de  lechuga.18  Se  utilizaron  tres  cajas  de  Petri  de  10 
centfmetros.  La  primera  contema  26  semillas  de  lechuga; 
la  segunda,  26  semillas  de  rabano  y,  la  tercera,  13 
semillas  de  lechuga  y  13  de  rabano. 

a.  Suponga  que  el  experimentador  tern'a  un  paquete  de  50 
semillas  de  rabanos  y  otro  de  50  semillas  de  lechuga. 
Disene  un  plan  para  asignar  al  azar  las  semillas  de 
rabanos  y  lechuga  a  los  tres  grupos  de  tratamiento. 

b.  tQue  suposiciones  debe  hacer  el  experimentador 
acerca  de  los  paquetes  de  50  semillas  para  asegurar  lo 
aleatorio  del  experimento? 

7.68  9/11  Un  estudio  de  alrededor  de  n  =  1000 
personas  en  Estados  Unidos,  durante  los  dfas  21-22 
de  septiembre  de  2001,  dejo  ver  que  43%  de  quienes 
respondieron  indicaron  que  estaban  menos  dispuestos 
a  volar  despues  de  los  eventos  del  1 1  de  septiembre  de 
2001. 19 

a.  (,  Cs  este  un  estudio  de  observacion  o  un  experimento 
disenado? 

b.  ^Que  problemas  podrfan  haber  ocurrido  debido  a  la 
naturaleza  sensible  del  tema?  (,Que  clases  de  sesgos 
podrfan  haber  ocurrido? 

7.69  Servicio  telefonico  Suponga  que  el  ejecutivo  de 
una  companfa  telefonica  desea  seleccionar  una  muestra 
aleatoria  de  n  =  20  (se  usa  un  numero  pequeno  para 
simplificar  el  ejercicio)  de  entre  7000  clientes  para 

un  estudio  de  las  actitudes  de  clientes  respecto  al 
servicio.  Si  los  clientes  se  numeran  con  fines  de 
identificacion,  indique  los  clientes  a  quienes  incluirfa 
usted  en  su  muestra.  Use  la  tabla  de  numero  aleatorio  y 
explique  como  seleccionarfa  su  muestra. 

7.70  F?h  positivo  La  proporcion  de  personas  con  tipo 
de  sangre  Rh  positivo  es  85%.  Usted  tiene  una  muestra 
aleatoria  de  n  =  500  personas. 

a.  ^Cuales  son  la  media  y  desviacion  estandar  de  p,  la 
proporcion  muestral  con  tipo  de  sangre  Rh  positivo? 

b.  i,  La  distribucion  de  p  es  aproximadamente  normal? 
Justifique  su  respuesta. 

c.  ('Cual  es  la  probabilidad  de  que  la  proporcion  muestral 
p  exceda  de  82%  ? 

d.  ('Cual  es  la  probabilidad  de  que  la  proporcion  muestral 
se  encuentre  entre  83%  y  88%? 

e.  99%  del  tiempo,  <4  a  proporcion  muestral  estarfa  entre 
cuales  dos  lfmites? 

7.71  (iQue  diseno  de  estudio  se  utiliza  en  cada  una  de 
estas  situaciones? 

a.  Se  selecciona  una  muestra  aleatoria  de  n  =  50 
manzanas  de  ciudad  y  se  realiza  un  censo  por  cada 
vivienda  unifamiliar  en  cada  manzana. 


b.  Una  patrulla  de  caminos  detiene  a  uno  de  cada  10 
vehfculos  en  una  calle  determinada,  entre  las  9:00  a.m. 
y  las  3:00  p.m.  para  efectuar  una  revision  rutinaria 
sobre  seguridad  de  transito. 

c.  Cien  familias  en  cada  una  de  cuatro  delegaciones 
citadinas  son  encuestadas  respecto  a  un  referendo 
pendiente  de  desgravacion  de  impuestos. 

d.  Se  inspecciona  uno  de  cada  10  arboles  de  una 
plantacion  de  tala  de  pinos  si  esta  infestado  del  gusano 
barrenador. 

e.  Una  muestra  aleatoria  de  n  =  1000  contribuyentes 
de  la  ciudad  de  San  Bernardino  es  seleccionada  por 
el  Servicio  de  impuestos  interno  y  se  auditan  sus 
declaraciones  de  impuestos. 

7.72  Cargas  de  elevadores  La  carga  maxima  (con 
un  generoso  factor  de  seguridad)  para  el  elevador  de  un 
edificio  de  oficinas  es  de  2000  libras.  La  distribucion  de 
frecuencia  relativa  de  los  pesos  de  todos  los  hombres  y 
mujeres  que  usan  el  elevador  tiene  forma  de  montfculo 
(ligeramente  sesgada  a  los  pesos  pesados),  con  una 
media  /x  igual  a  150  libras  y  desviacion  estandar  crde  35 
libras.  ^Cual  es  el  numero  maximo  de  personas  que  se 
pueden  permitir  en  el  elevador,  si  se  desea  que  el  peso 
total  de  ellas  exceda  del  peso  maximo  con  una  pequena 
probabilidad  (por  ejemplo,  cercano  a  .01)?  (sugerencia: 

Si  xu  x2,  . . . ,  x„  son  observaciones  independientes  hechas 
en  una  variable  aleatoria  x,  y  si  x  tiene  media  /x  y  varianza 
or,  entonces  la  media  y  varianza  de  Xx,  son  «/x  y  no2, 
respectivamente.  Este  resultado  se  dio  en  la  section  7.4.) 

7.73  Paquetes  de  alambrado  El  numero  de 
paquetes  de  alambrado  que  pueden  ser  ensamblados  por 
los  empleados  de  una  companfa  tiene  una  distribucion 
normal,  con  una  media  igual  a  16.4  por  hora  y  una 
desviacion  estandar  de  1.3  por  hora. 

a.  ^Cuales  son  la  media  y  desviacion  estandar  del 
numero  x  de  paquetes  producidos  por  trabajador  en  un 
dfa  de  8  horas? 

b.  (■,Se  espera  que  la  distribucion  de  probabilidad  de  x  sea 
de  forma  de  montfculo  y  aproximadamente  normal? 
Explique. 

c.  <,Cual  es  la  probabilidad  de  que  un  trabajador 
produzca  al  menos  135  paquetes  por  dfa  de  8  horas? 

7.74  Paquetes  de  alambrado,  continua  Consulte 
el  ejercicio  7.73.  Suponga  que  la  companfa  emplea  10 
ensambladores  de  paquetes  de  alambrado. 

a.  Encuentre  la  media  y  desviacion  estandar  de  la 
produccion  diaria  de  la  companfa  (dfa  de  8  horas)  de 
paquetes  de  alambrado. 

b.  (Cual  es  la  probabilidad  de  que  la  produccion 
diaria  de  la  companfa  sea  menor  a  1280  paquetes  de 
alambrado  por  dfa? 
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(^)datos  7.75  Focos  defectuosos  La  tabla 

siguiente  es  una  lista  del  numero  de  focos 
defectuosos  de  60  watts,  hallados  en  muestras  de 
100  focos  seleccionados  en  25  dfas  del  proceso  de 
un  fabricante.  Suponga  que  durante  estos  25  dfas  el 
proceso  de  manufactura  no  estuvo  produciendo  una  parte 
excesivamente  grande  de  focos  defectuosos. 


Dfa 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

Defectuosos 

4 

2 

5 

8 

3 

4 

4 

5 

6 

1 

Dfa 

11 

12 

13 

14 

15 

16 

17 

18 

19 

20 

Defectuosos 

2 

4 

3 

4 

0 

2 

3 

1 

4 

0 

Dfa 

21 

22 

23  24 

25 

Defectuosos 

2 

2 

3  5 

3 

a.  Construya  una  grafica  p  para  vigilar  el  proceso  de 
manufactura  y  grafique  los  datos. 

b.  ^Que  tan  grande  debe  ser  la  fraccion  de  artfculos 
defectuosos  en  una  muestra  seleccionada  del 
proceso  de  manufactura,  antes  que  se  considere 
que  el  proceso  esta  fuera  de  control? 

c.  Durante  un  dfa  determinado,  suponga  que  una 
muestra  de  100  artfculos  se  selecciona  del  proceso  de 
manufactura  y  se  encuentran  15  focos  defectuosos.  Si  se 
toma  una  decision  de  cerrar  el  proceso  de  manufactura, 
en  un  intento  por  localizar  la  fuente  de  la  variation 
sobreentendida  controlable,  explique  la  forma  en  que 
esta  decision  puede  llevar  a  conclusiones  erroneas. 

7.76  Focos,  continua  Una  cadena  de  ferreterfas 
compra  grandes  cantidades  de  focos,  del  fabricante 
descrito  en  el  ejercicio  7.75  y  especifica  que  cada 
embarque  debe  contener  no  mas  de  4%  de 
defectuosos.  Cuando  el  proceso  de  manufactura  esta  en 
control,  ^cual  es  la  probabilidad  de  que  sean  satisfechas 
las  especificaciones  de  la  cadena  de  ferreterfas? 

7.77  Focos,  otra  vez  Consulte  el  ejercicio  7.75. 
Durante  una  semana  determinada,  el  numero  de  focos 
defectuosos  en  cada  una  de  cinco  muestras  de  entre  100 
se  encontraron  2,  4,  9,  7  y  1 1. 1 H ay  razon  para  creer  que 
el  proceso  de  produccion  ha  estado  produciendo  una 
proportion  excesiva  de  focos  defectuosos  en  cualquier 
tiempo  durante  la  semana? 

f^) datos  7.78  Tomates  enlatados  Durante  largas 
series  de  produccion  de  tomates  enlatados,  los 
pesos  promedio  (en  onzas)  de  muestras  de  cinco  latas 
de  tomates  de  calidad  estandar,  en  forma  de  pure,  se 
tomaron  en  30  puntos  de  control  durante  un  periodo 
de  1 1  dfas.  Estos  resultados  se  muestran  en  la  tabla.20 
Cuando  la  maquina  esta  funcionando  normalmente,  el 
peso  promedio  por  lata  es  de  2 1  onzas  con  una  desviacion 
estandar  de  1.20  onzas. 


a.  Calcule  los  lfmites  superior  e  inferior  de  control  y  la 
lfnea  del  centra  para  la  grafica  x. 

b.  Grafique  los  datos  muestrales  en  la  grafica  x  y 
determine  si  la  operation  de  la  maquina  esta  en 
control. 


Muestra 

numero 

Peso 

promedio 

Muestra 

numero 

Peso 

promedio 

i 

23.1 

16 

21.4 

2 

21.3 

17 

20.4 

3 

22.0 

18 

22.8 

4 

21.4 

19 

21.1 

5 

21.8 

20 

20.7 

6 

20.6 

21 

21.6 

7 

20.1 

22 

22.4 

8 

21.4 

23 

21.3 

9 

21.5 

24 

21.1 

10 

20.2 

25 

20.1 

11 

20.3 

26 

21.2 

12 

20.1 

27 

19.9 

13 

21.7 

28 

21.1 

14 

21.0 

29 

21.6 

15 

21.6 

30 

21.3 

Fuente :  Adaptado  de  J.  Hackl,  Journal  of  Quality  Technology,  abril 
de  1991.  Utilizado  con  permiso. 


7.79  Pepsi  o  Coca  La  batalla  por  la  preferencia  del 
consumidor  continua  entre  Pepsi  y  Coca-Cola.  ^Como 
se  pueden  conocer  las  preferencias  de  usted?  Hay  una 
pagina  web  donde  se  puede  votar  por  una  de  las  dos 
bebidas  de  cola  si  da  un  clic  en  el  vinculo  que  dice 
PAY  CASH  por  su  opinion.  Explique  por  que  quienes 
responden  no  representan  una  muestra  aleatoria  de  las 
opiniones  de  compradores  o  consumidores  de  estos 
refrescos.  Explique  los  tipos  de  distorsiones  que  podrfan 
comenzar  a  notarse  en  una  encuesta  de  opiniones  en 
internet. 

7.80  -resas  Un  experimentador  desea  hallar  una 
temperatura  apropiada  a  la  cual  almacenar  fresas 
frescas,  para  reducir  al  mfnimo  la  perdida  de  acido 
ascorbico.  Hay  20  recipientes  de  almacenamiento,  cada 
uno  con  temperatura  controlable,  en  los  que  se  pueden 
guardar  fresas.  Si  han  de  usarse  dos  temperaturas  de 
almacenamiento,  ^como  podrfa  el  experimentador  asignar 
los  20  contenedores  a  una  de  las  dos  temperaturas? 

7.81  Llenado  de  latas  de  refrescos  Un 

embotellador  de  bebidas  gaseosas  empaca  latas  en 
paquetes  de  seis.  Suponga  que  el  lfquido  por  lata  tiene 
una  distribucion  normal  aproximada  con  una  media  de  12 
onzas  de  lfquido  y  una  desviacion  estandar  de  0.2  onzas 
de  lfquido. 

a.  (',Cual  es  la  distribucion  del  total  de  lfquido  para  una 
caja  de  24  latas? 

b.  (■.Ciial  es  la  probabilidad  de  que  el  total  de  lfquido  para 
una  caja  sea  menor  a  286  onzas  de  lfquido? 
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c.  Si  un  paquete  de  seis  latas  de  refresco  se  puede 
considerar  como  muestra  aleatoria  de  tamano  n  =  6 
de  la  poblacion,  ^cual  es  la  probabilidad  de  que  el 
promedio  de  lfquido  por  lata  para  un  paquete  de  seis 
latas  de  refresco  sea  menor  a  1 1.8  onzas  de  lfquido? 

7.82  Peso  total  al  envasar  Paquetes  de  alimento 
cuyo  peso  promedio  es  16  onzas,  con  desviacion  estandar 
de  0.6  onzas,  se  envfan  en  cajas  de  24  paquetes.  Si  los 
pesos  de  paquete  estan  normalmente  distribuidos  en 
forma  aproximada,  ^cual  es  la  probabilidad  de  que  una 
caja  de  24  paquetes  pese  mas  de  392  onzas  (24.5  libras)? 

7.83  Componentes  electronicos  Unprocesode 
manufactura  esta  disenado  para  producir  un  componente 


electronico  para  uso  en  pequenos  televisores  portatiles. 
Los  componentes  son  todos  de  tamano  estandar  y  no 
necesitan  apegarse  a  ninguna  caracterfstica  mensurable, 
pero  a  veces  son  inoperables  cuando  emergen  del 
proceso  de  manufactura.  Se  seleccionaron  15  muestras 
del  proceso  por  tiempos  cuando  se  sabfa  que  el  proceso 
estaba  en  control.  Quince  componentes  se  observaron 
dentro  de  cada  muestra  y  se  registro  el  numero  de 
componentes  inoperables. 

6,  7,  3,5,6,  8,4,  5,7,3,  1,6,  5,4,  5 

Construya  una  grafica  p  para  vigilar  el  proceso  de 
manufactura. 


m  APPLET  sic:  os 

7.84  Dados  Consulte  el  experimento  de  lanzar 

un  dado  con  n  =  1  en  la  seccion  7.4,  en  el  que  x  es  el 

numero  en  la  cara  superior  de  un  solo  dado  balanceado. 

a.  Use  las  formulas  de  la  seccion  4.8  para  verificar  que 
p  =  3.5  y  cr  =  1.71  para  esta  poblacion. 

b.  Use  el  applet  Central  Limit  Theorem  para  tirar  un 
solo  dado  al  menos  2000  veces.  (Su  simulacion  se 
puede  hacer  rapidamente  usando  el  boton  S3  i 
/  C u ales  son  la  media  y  desviacion  estandar  de  estas 
2000  observaciones?  ^Cual  es  la  forma  del 
histograma? 

c.  Compare  los  resultados  del  inciso  b)  con  la 
distribucion  real  de  probabilidad  que  se  muestra  en  la 
figura  7.3  y  la  media  real  y  desviacion  estandar  en  el 
inciso  a).  Deben  ser  similares. 

7.85  Dados  Se  lanzan  dos  dados  balanceados  y  se 

registra  el  numero  promedio  de  las  dos  caras  superiores. 

a.  Use  los  valores  p  =  3.5  y  cr  =  1.71  del  ejercicio  7.84. 
ACuales  son  la  media  y  desviacion  estandar  teoricas  de 
la  distribucion  muestral  para  i? 

b.  Use  el  applet  Central  Limit  Theorem  para  lanzar  un 

solo  dado  al  menos  2000  veces.  (Su  simulacion  se 
puede  hacer  rapidamente  usando  el  boton  _  _ 3.) 

/  C u ales  son  la  media  y  desviacion  estandar  de  estas 
2000  observaciones?  <;Cual  es  la  forma  del 
histograma? 

c.  Compare  los  resultados  del  inciso  b)  con  la  distribucion 
real  de  probabilidad  que  se  ve  en  la  figura  7.4  y  la  media 
y  desviacion  estandar  reales  del  inciso  a). 


7.86  Repita  las  instrucciones  del  ejercicio  7.85  cuando 
se  lancen  tres  dados. 

7.87  Repita  las  instrucciones  del  ejercicio  7.85  cuando 
se  lancen  cuatro  dados. 

7.88  Suponga  que  una  muestra  aleatoria  de  n  =  5 
observaciones  se  selecciona  de  una  poblacion  que 
esta  normalmente  distribuida,  con  media  igual  a  1  y 
desviacion  estandar  igual  a  .36. 

a.  De  la  media  y  desviacion  estandar  de  la  distribucion 
muestral  de  x. 

b.  Encuentre  la  probabilidad  de  que  x  exceda  de  1.3, 
usando  el  applet  Normal  Probabilities  for  Means. 

c.  Encuentre  la  probabilidad  de  que  la  media  muestral  x 
sea  menor  a  .5. 

d.  Encuentre  la  probabilidad  de  que  la  media  muestral  se 
desvfe  de  la  media  poblacional  p  =  I  en  mas  de  .4. 

7.89  Baterias  Se  sabe  que  cierto  tipo  de  baterfas 
para  automovil  dura  un  promedio  de  1110  dfas  con  una 
desviacion  estandar  de  80  dfas.  Si  400  de  estas  baterias 
se  seleccionan,  use  el  applet  Normal  Probabilities  for 
Means  para  hallar  las  siguientes  probabilidades  para  la 
duracion  promedio  de  vida  de  las  baterias  seleccionadas: 

a.  El  promedio  esta  entre  1 100  y  1110. 

b.  El  promedio  es  mayor  a  1120. 

c.  El  promedio  es  menor  a  900. 
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CASO 

prActico 


Muestreo  de  la  Ruleta  de  Monte  Carlo 


La  tecnica  de  simular  un  proceso  que  contiene  elementos  aleatorios  y  repetir  el  proceso 
una  y  otra  vez,  para  ver  como  se  comporta,  recibe  el  nombre  de  metodo  de  Monte  Carlo. 
Se  usa  ampliamente  en  finanzas  y  otros  campos  para  investigar  las  propiedades  de  una 
operacion  que  esta  sujeta  a  efectos  aleatorios,  por  ejemplo  el  clima,  la  conducta  humana, 
etcetera.  Por  ejemplo,  se  podrfa  modelar  el  comportamiento  del  inventario  de  una  com- 
panfa  manufacturera  al  crear,  en  papel,  llegadas  y  salidas  diarias  de  productos  manu- 
facturados  desde  el  almacen  de  la  compama.  Cada  dfa,  un  numero  aleatorio  de  artfculos 
producidos  por  la  companfa  serfa  recibido  en  inventario.  Del  mismo  modo,  cada  dfa  un 
numero  aleatorio  de  pedidos  de  diferentes  tamanos  aleatorios  se  enviarfa.  Con  base  en  la 
entrada  y  salida  de  artfculos,  se  podrfa  calcular  el  inventario  o  sea  el  numero  de  artfculos 
disponibles  al  finalizar  cada  dfa.  Los  valores  de  las  variables  aleatorias,  el  numero  de 
artfculos  producidos,  el  numero  de  pedidos  y  el  numero  de  artfculos  por  pedido  necesa- 
rios  para  la  simulacion  de  cada  dfa,  se  obtendrfa  de  distribuciones  teoricas  de  observa- 
ciones  que  modelan  muy  de  cerca  las  correspondientes  distribuciones  de  las  variables  que 
se  han  observado  en  el  tiempo  de  la  operacion  de  manufactura.  Al  repetir  la  simulacion 
del  suministro,  el  envfo  y  el  calculo  del  inventario  diario  para  un  gran  numero  de  dfas  (un 
muestreo  de  lo  que  podrfa  realmente  ocurrir),  se  puede  observar  el  comportamiento  del 
inventario  diario  de  la  planta.  El  metodo  de  Monte  Carlo  es  particularmente  valioso  por- 
que  hace  posible  que  el  fabricante  vea  como  se  comportarfa  el  inventario  diario,  cuando 
se  hacen  ciertos  cambios  en  el  patron  de  abastecimiento  o  en  algun  otro  aspecto  de  la 
operacion  que  podrfa  ser  controlado. 

En  un  artfculo  titulado  “El  Camino  a  Monte  Carlo”,  Daniel  Seligman  comenta  sobre 
el  metodo  de  Monte  Carlo,  observando  que  aun  cuando  la  tecnica  se  utiliza  ampliamente 
en  escuelas  de  finanzas  para  estudiar  el  presupuesto  de  capital,  planeacion  de  inventarios 
y  administracion  de  flujos  de  efectivo,  nadie  parece  haber  usado  el  procedimiento  para 
estudiar  lo  bien  que  la  harfamos  si  fueramos  a  jugar  en  Monte  Carlo.21 

Para  seguir  sobre  esta  idea,  Seligman  programo  su  computadora  personal  para  simu¬ 
lar  el  juego  de  la  ruleta.  La  ruleta  es  una  rueda  con  su  borde  dividido  en  38  buchacas. 
Treinta  y  seis  de  estas  estan  numeradas  del  1  al  36  y  tienen  colores  alternados  de  rojo  y 
negro.  Las  dos  buchacas  restantes  tienen  color  verde  y  estan  marcadas  0  y  00.  Para  jugar 
en  la  ruleta,  se  apuesta  cierta  cantidad  de  dinero  a  una  o  mas  buchacas,  a  continuation 
de  lo  cual  la  rueda  se  hace  girar  hasta  detenerse.  Una  pequena  esfera  cae  en  una  ranura 
en  la  rueda  para  indicar  el  numero  ganador.  Si  usted  tiene  dinero  en  ese  numero,  gana 
una  cantidad  especificada.  Por  ejemplo,  si  fuera  a  jugar  el  numero  20,  la  paga  serfa  35  a 
1.  Si  la  rueda  no  se  detiene  en  ese  numero,  usted  pierde  su  apuesta.  Seligman  decidio  ver 
como  serfan  sus  ganancias  (o  perdidas)  nocturnas  si  fuera  a  apostar  $5  en  cada  giro  de  la 
rueda  y  repetir  el  proceso  200  veces  por  noche.  Hizo  esto  365  veces,  con  lo  cual  simulaba 
los  resultados  de  365  noches  en  el  casino.  Sin  ninguna  sorpresa,  la  “ganancia”  media  por 
noche  de  $1000  para  las  365  noches  fue  una perdida  de  $55,  el  promedio  de  las  ganancias 
retenidas  por  la  casa.  La  sorpresa,  de  acuerdo  con  Seligman,  fue  la  extrema  variabilidad 
de  las  “ganancias”  nocturnas.  Siete  veces,  de  entre  las  365,  el  jugador  ficticio  perdio  la 
apuesta  de  $1000  y  solo  una  vez  gano  un  maximo  de  $1160.  En  141  noches,  la  perdida 
fue  mas  de  $250. 


1.  Para  evaluar  los  resultados  del  experimento  de  Monte  Carlo  de  Seligman,  primero 
encuentre  la  distribution  de  probabilidad  de  la  ganancia  x  en  una  sola  apuesta  de  $5. 

2.  Encuentre  el  valor  y  varianza  esperados  de  la  ganancia  x  del  punto  1 . 
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3.  Encuentre  el  valor  esperado  y  varianza  para  la  ganancia  de  la  noche,  la  suma  de  las 
ganancias  o  perdidas  para  las  200  apuestas  de  $5  cada  una. 

4.  Use  los  resultados  del  punto  2  para  evaluar  la  probabilidad  de  que  7  de  entre  365 
noches  resulten  en  una  perdida  de  la  apuesta  total  de  $1000. 

5.  Use  los  resultados  del  punto  3  para  evaluar  la  probabilidad  de  que  las  ganancias  mas 
grandes  de  la  noche  fuera  de  hasta  $1160. 
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Estimacion 
de  muestras 
grandes 


OBJETIVO  GENERAL 

En  capltulos  previos,  usted  ya  se  entero  de  las  distri- 
buciones  de  probabilidad  de  variables  aleatorias  y  las 
distribuciones  muestrales  de  varias  estadlsticas  que,  para 
tamaiios  muestrales  grandes,  pueden  ser  aproximadas 
por  una  distribucion  normal  de  acuerdo  con  el  teorema 
del  limite  central.  Este  capftulo  presenta  un  metodo  para 
estimar  parametros  poblacionales  e  ilustra  el  concepto 
con  ejemplos  practicos.  El  teorema  del  limite  central 
y  las  distribuciones  muestrales  presentadas  en  el 
capltulo  7  desempenan  un  papel  clave  para  evaluar  la 
confiabilidad  de  estimaciones. 


INDICE  DEL  CAPITULO 

Seleccion  del  tamano  muestral  (8.9) 

Estimacion  de  la  diferencia  entre  dos  proporciones 
binomiales  (8.6) 

Estimacion  de  la  diferencia  entre  dos  medias 
poblacionales  (8.6) 

Estimacion  de  intervalos  (8.5) 

Intervalos  de  confianza  de  muestra  grande  para  una 
media  o  proporcion  poblacional  (8.5) 

Limites  de  confianza  de  un  lado  (8.8) 

Seleccion  del  mejor  estimador  puntual  (8.4) 

Estimacion  puntual  para  una  media  o  proporcion 
poblacional  (8.4) 

Tipos  de  estimadores  (8.3) 


ENTRENADOR  PERSONAL 


iComo  estimo  una  media  o  proporcion 
poblacional? 

£Como  escojo  el  tamano  muestral? 


(Que  tan  confiable 

es  la  encuesta? 

yHacer  encuestas  nacionales  por  las  organiza- 
ciones  de  Hams  y  Gallup,  los  medios  de  comu- 
nicacion  y  otras  brindan  estimaciones  precisas 
de  los  porcentajes  de  personas  en  Estados  Uni- 
dos  que  tienen  diversos  habitos  alimenticios?  El 
Caso  practico  al  final  de  este  capitulo  examina  la 
confiabilidad  de  una  encuesta  realizada  por  CBS 
News,  utilizando  teorfa  de  estimacion  de  mues¬ 
tras  grandes. 
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DONDE  HEMPS  ESTADQ 

Los  primeros  siete  capftulos  de  este  libro  han  dado  a  usted  el  material  que  necesitara  para 
entender  una  inferencia  estadfstica  y  como  puede  aplicarse  esta  en  situaciones  practicas. 
Los  primeros  tres  capitulos  se  refieren  al  uso  de  estadisticas  descriptivas,  tanto  graficas 
como  numericas,  para  describir  e  interpretar  conjuntos  de  mediciones.  En  los  siguientes 
tres  capitulos  vimos  probabilidad  y  distribuciones  de  probabilidad,  que  son  las  herra- 
mientas  basicas  empleadas  para  describir  poblaciones  de  mediciones.  Las  distribuciones 
binomiales  y  normales  se  destacaron  como  importantes  para  aplicaciones  practicas. 
Numerosas  estadfsticas  son  sumas  o  promedios  calculados  de  mediciones  muestrales.  El 
teorema  del  limite  central  dice  que,  incluso  si  las  poblaciones  muestrales  no  son  norma¬ 
les,  las  distribuciones  muestrales  de  esas  estadisticas  seran  aproximadamente  normales 
cuando  el  tamano  muestral  n  es  grande.  Estas  estadisticas  son  las  herramientas  que  se 
usaran  para  estadisticas  inferenciales,  es  decir,  hacer  inferencias  acerca  de  una  pobla¬ 
cion  usando  informacion  contenida  en  una  muestra. 


A  DONDE  VOY; 

INFERENCIA  ESTADISTICA 

La  inferencia,  especificamente  la  toma  y  prediccion  de  decisiones,  tiene  siglos  de  anti- 
giiedad  y  desempena  un  papel  muy  importante  en  la  vida  de  casi  todas  las  personas. 
Veamos  a  continuation  algunas  aplicaciones: 


•  El  gobierno  necesita  predecir  las  tasas  de  interes  a  corto  y  largo  plazos. 

•  Un  corredor  financiero  desea  pronosticar  el  comportamiento  del  mercado  de 
acciones. 

•  Un  metalurgista  desea  determinar  si  un  nuevo  tipo  de  acero  es  mas  resistente  a 
altas  temperaturas  que  el  actual. 

•  Una  consumidora  desea  estimar  el  precio  de  venta  de  su  casa  antes  de  ponerla  en 
el  mercado. 


Parametro  <=>  poblacion. 
Estadfstica  «■  muestra. 


Hay  muchas  formas  de  tomar  estas  decisiones  o  predicciones,  algunas  son  subjetivas  y 
otras  son  objetivas  por  naturaleza.  ^Que  tan  buenas  seran  las  predicciones  o  decisiones? 
Aun  cuando  usted  pueda  pensar  que  su  propia  capacidad  de  tomar  decisiones  es  muy 
buena,  la  experiencia  sugiere  que  este  puede  no  ser  el  caso.  Es  la  funcion  del  estadistico 
matematico  dar  metodos  de  toma  de  inferencia  estadfstica  son  mejores  y  mas  confiables 
que  unicamente  calculos  subjetivos. 

La  inferencia  estadfstica  se  ocupa  de  tomar  decisiones  o  predicciones  acerca  de 
parametros,  es  decir,  las  medidas  numericas  descriptivas  que  caracterizan  a  una  po¬ 
blacion.  Tres  parametros  que  encontramos  en  capftulos  anteriores  son  la  media  pobla- 
cional  /r,  la  desviacion  poblacional  estandar  cr  y  la  proportion  binomial  p.  En  infe¬ 
rencia  estadfstica,  un  problema  practico  se  expone  de  otra  forma  en  el  marco  de  una 
poblacion  con  un  parametro  especffico  de  interes.  Por  ejemplo,  el  metalurgista  podrfa 
medir  el  promedio  de  coeficientes  de  expansion  de  ambos  tipos  de  acero  y  luego  com¬ 
parer  sus  valores. 

Los  metodos  para  hacer  inferencias  acerca  de  parametros  poblacionales  caen  en  una 
de  dos  categories: 

•  Estimacion:  Estimar  o  predecir  el  valor  del  parametro 

•  Prueba  de  hipotesis:  Tomar  una  decision  acerca  del  valor  de  un  parametro,  con 
base  en  alguna  idea  preconcebida  acerca  de  cual  podrfa  ser  su  valor 
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Los  circuitos  en  computadoras  y  otros  equipos  electronicos  estan  formados  por  una  o 
mas  tarjetas  de  circuito  impreso  (PCB)  y  es  frecuente  que  las  computadoras  sean  repara- 
das  con  solo  cambiar  una  o  mas  de  estas  tarjetas.  En  un  intento  por  hallar  el  ajuste  apro- 
piado  de  un  proceso  de  chapa  aplicado  a  uno  de  los  lados  de  una  PCB,  un  supervisor  de 
production  podrfa  estimar  el  grosor  aproximado  de  chapa  de  cobre  en  las  PCB  usando 
muestras  de  varios  dfas  de  operation.  Como  no  sabe  del  grosor  promedio  /x  antes  de 
observar  el  proceso  de  production,  el  suyo  es  un  problema  de  estimation. 


El  supervisor  del  ejemplo  8.1  recibe  instrucciones  del  propietario  de  la  planta  de  que  el 
grosor  de  la  chapa  de  cobre  no  debe  ser  menor  a  .001  de  pulgada,  para  que  el  proceso 
este  en  control.  Para  decidir  si  el  proceso  esta  o  no  esta  en  control,  el  supervisor  debe 
formular  una  prueba.  Podrfa  hacer  una  hipotesis  de  que  el  proceso  esta  en  control,  es 
decir,  suponer  que  el  grosor  promedio  de  la  chapa  de  cobre  es  .001  o  mas,  y  usar  mues¬ 
tras  de  varios  dfas  de  operation  para  decidir  si  es  o  no  es  correcta  su  hipotesis.  El  metodo 
de  la  toma  de  decision  del  supervisor  se  denomina  prueba  de  hipotesis. 


^Cual  metodo  de  inferencia  debe  usarse?  Esto  es,  £el  parametro  debe  ser  estimado  o 
se  debe  probar  una  hipotesis  respecto  a  su  valor?  La  respuesta  esta  dictada  por  la  pre- 
gunta  practica  planteada  y  a  veces  es  determinada  por  preferencias  personales.  Como 
la  estimation  y  las  pruebas  de  hipotesis  se  usan  con  frecuencia  en  literature  cientffica, 
incluimos  ambos  metodos  en  este  y  el  siguiente  capftulo. 

Un  problema  estadfstico,  que  comprende  planeacion,  analisis  y  toma  de  inferencias, 
esta  incompleto  sin  una  medida  de  la  bondad  de  la  inferencia.  Esto  es,  cpie  tan  preciso 
o  confiable  es  el  metodo  empleado?  Si  una  corredora  financiera  predice  que  el  precio 
de  una  action  sera  de  $80  el  proximo  lunes,  ^estarfa  usted  dispuesto  a  tomar  acciones 
para  comprar  o  vender  su  action  sin  saber  que  tan  confiable  es  la  prediction  de  ella?  i  La 
prediction  estara  a  no  mas  de  $1,  $2  o  $10  del  precio  real  el  proximo  lunes?  Los  proce- 
dimientos  estadfsticos  son  importantes  porque  dan  dos  tipos  de  information: 

•  Metodos  para  hacer  la  inferencia 

•  Una  medida  numerica  de  la  bondad  o  confiabilidad  de  la  inferencia 


TIPOS  DE  ESTIMADORES 

Para  estimar  el  valor  de  un  parametro  poblacional,  se  puede  usar  information  de  la 
muestra  en  la  forma  de  un  estimador.  Los  estimadores  se  calculan  usando  information 
de  las  observaciones  muestrales  y,  en  consecuencia,  por  definition  son  tambien  estadis- 
ticas. 


Definicion  Un  estimador  es  una  regia,  generalmente  expresada  como  formula,  que 
nos  dice  como  calcular  una  estimation  basada  en  information  de  la  muestra. 


Los  estimadores  se  usan  en  dos  formas  diferentes: 

•  Estimacion  puntual:  Con  base  en  datos  muestrales,  se  calcula  un  solo  numero 
para  estimar  el  parametro  poblacional.  La  regia  o  formula  que  describe  este 
calculo  se  denomina  estimador  puntual  y  el  numero  resultante  recibe  el 
nombre  de  estimacion  puntual. 
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•  Estimacion  de  intervalo:  Con  base  en  datos  muestrales,  dos  numeros  se  calcu- 
lan  para  formar  un  intervalo  dentro  del  cual  se  espera  este  el  parametro.  La  regia 
o  formula  que  describe  este  calculo  se  denomina  estimador  de  intervalo  y  el  par 
de  numeros  resultantes  se  llama  estimacion  de  intervalo  o  intervalo  de  con- 
fianza. 


ejemplo  J  8.3  Un  veterinario  desea  estimar  el  aumento  mensual  promedio  en  el  peso  de  cachorros  de 

raza  golden  retriever,  de  4  meses  de  edad,  que  han  sido  puestos  a  dieta  de  came  de  cor- 
dero  y  arroz.  La  poblacion  esta  formada  por  los  aumentos  mensuales  en  el  peso  de  todos 
los  cachorros  de  raza  golden  retriever  a  los  que  se  da  esta  dieta  particular.  El  veterinario 
desea  estimar  el  parametro  desconocido  p.  el  aumento  mensual  promedio  en  el  peso 
para  esta  poblacion  hipotetica.  Un  posible  estimador  basado  en  datos  muestrales  es  la 
media  muestral,  x  =  Xxjn.  Podrfa  usarse  en  la  forma  de  un  solo  numero  o  estimacion 
puntual,  por  ejemplo  3.8  libras,  o  podrfa  usarse  una  estimacion  de  intervalo  y  estimar 
que  el  aumento  promedio  en  el  peso  sera  entre  2.7  y  4.9  libras. 


Los  procedimientos  de  estimacion  tanto  puntuales  como  de  intervalo  usan  informa- 
cion  dada  por  la  distribution  muestral  del  estimador  espetifico  que  se  haya  escogido 
para  usarse.  Empezaremos  por  exponer  la  estimacion  puntual  y  su  uso  para  estimar 
medias  poblacionales  y  proporciones. 


CONSEJO 

Parametro  =  diana  del 
bianco. 

Estimador  =  bala  o  flecha. 


ESTIMACION  PUNTUAL 


En  una  situation  practica,  puede  haber  varias  estadfsticas  que  podrfan  usarse  como  esti- 
madores  puntuales  para  un  parametro  poblacional.  Para  determinar  cual  de  las  opciones 
es  mejor,  usted  necesita  saber  como  se  comporta  el  estimador  en  muestreo  repetido, 
descrito  por  su  distribucion  muestral. 

Por  medio  de  analogfa,  considere  en  disparar  un  revolver  a  un  bianco.  El  parametro 
de  interes  es  la  diana  a  la  cual  se  disparan  balas.  Cada  bala  representa  una  sola  estima¬ 
tion  muestral,  disparada  por  el  revolver,  que  representa  el  estimador.  Suponga  que  un 
amigo  dispara  una  sola  bala  y  acierta  en  la  diana.  ^Se  puede  concluir  que  el  es  un  exce- 
lente  tirador?  ^Se  pondrfa  usted  de  pie  junto  al  bianco  cuando  el  dispare  una  segunda 
bala?  Es  probable  que  no,  porque  no  tiene  medida  de  lo  bien  que  el  dispare  en  intentos 
repetidos.  ^Siempre  acierta  en  el  bianco  o  sus  tiros  son  demasiado  altos  o  demasiado 
bajos  en  forma  consistente?  ^Sus  tiros  se  agrupan  alrededor  del  bianco  o  fallan  acertar 
en  el  bianco  por  un  amplio  margen?  La  figura  8.1  muestra  varias  configuraciones  del 
bianco.  (;  Cual  bianco  escogerfa  usted  como  perteneciente  al  mejor  tiro? 


FIGURA  8.1 

;Cual  tirador  es  el  mejor? 


Consistentemente 
debajo  de 
la  diana 


Consistentemente  Fuera  de  la  diana 

arriba  de  por  un  amplio 

la  diana  margen 


El  mejor 
tirador 
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Las  distribuciones  muestrales  dan  informacion  que  se  puede  usar  para  seleccionar 
el  mejor  estimador.  ^Que  caracteristicas  serian  valiosas?  Primero,  la  distribution 
muestral  del  estimador  puntual  debe  estar  centrada  sobre  el  verdadero  valor  del 
parametro  a  ser  estimado.  Esto  es,  el  estimador  no  debe  subestimar  o  sobreestimar 
de  manera  consistente  al  parametro  de  interes.  Un  estimador  como  este  se  dice  que  es 
insesgado. 


Definicion  Se  dice  que  un  estimador  de  un  parametro  es  insesgado  si  la  media  de 
su  distribucion  es  igual  al  verdadero  valor  del  parametro.  De  otro  modo,  se  dice  que  el 
estimado  esta  sesgado. 


Las  distribuciones  muestrales  para  un  estimador  insesgado  y  estimador  sesgado  se  ven 
en  la  figura  8.2.  La  distribucion  muestral  para  el  estimador  sesgado  esta  corrida  a  la 
derecha  del  verdadero  valor  del  parametro.  Este  estimador  sesgado  es  mas  probable  que 
uno  insesgado  para  sobreestimar  el  valor  del  parametro. 


Verdadero  valor 
de  parametro 


La  segunda  caracterfstica  deseable  de  un  estimador  es  que  la  dispersion  (medida 
por  la  varianza)  de  la  distribucion  muestral  debe  ser  tan  pequena  como  sea  posi- 
ble.  Esto  asegura  que,  con  una  alta  probabilidad,  una  estimacion  individual  caera  cerca 
del  valor  verdadero  del  parametro.  Las  distribuciones  muestrales  para  dos  estimadores 
insesgados,  una  con  una  varianza  pequena^  la  otra  con  una  varianza  mas  grande,  como 
se  ve  en  la  figura  8.3. 


Verdadero  valor 
del  parametro 


+  En  general,  los  estadfsticos  usan  el  termino  varianza  de  un  estimador  cuando  en  realidad  es  la  varianza  de  la 
distribucion  muestral  del  estimador.  Esta  expresion  contraida  se  usa  casi  universalmente. 
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Por  supuesto  que  serfa  preferible  el  estimador  con  la  varianza  mas  pequena,  porque  las 
estimaciones  tienden  a  estar  mas  cerca  del  verdadero  valor  del  parametro  que  en  la  dis¬ 
tribution  con  la  varianza  mas  grande. 

En  situaciones  muestrales  practicas,  es  posible  saber  que  la  distribucion  muestral  de 
un  estimador  esta  centrada  alrededor  del  parametro  que  se  trate  de  estimar,  pero  todo 
lo  que  se  tiene  es  la  estimation  calculada  de  las  n  mediciones  contenidas  en  la  muestra. 
lA  que  distancia  del  verdadero  valor  del  parametro  estara  esta  estimation?  ^Que  tan 
cercana  esta  la  diana  o  bianco  de  la  bala  del  tirador?  La  distancia  entre  la  estimation  y  el 
verdadero  valor  del  parametro  se  denomina  error  de  estimation. 


Definicion  La  distancia  entre  una  estimation  y  el  parametro  estimado  recibe  el 
nombre  de  error  de  estimation. 


En  este  capitulo,  usted  puede  suponer  que  los  tamanos  muestrales  son  siempre  gran- 
des  y,  por  tanto,  que  los  estimadores  insesgados  que  estudiara  tienen  distribuciones 
muestrales  que  pueden  ser  aproximadas  por  una  distribucion  normal  (por  el  teorema 
del  limite  central).  Recuerde  que,  para  cualquier  estimador  puntual  con  una  distribucion 
normal,  la  regia  empirica  dice  que  aproximadamente  95%  de  todas  las  estimaciones 
puntuales  estaran  a  no  mas  de  dos  (o  mas  exactamente,  1 .96)  desviaciones  estandar  de 
la  media  de  esa  distribucion.  Para  estimadores  insesgados,  esto  implica  que  la  diferencia 
entre  el  estimador  puntual  y  el  verdadero  valor  del  parametro  sera  menor  a  1 .96  desvia¬ 
ciones  estandar  o  1.96  errores  estandar  (SE).  Esta  cantidad,  llamada  el  95%  de  margen 
de  error  (o  simplemente  “margen  de  error”),  da  un  limite  superior  practico  para  el 
error  de  estimation  (vease  la  figura  8.4).  Es  posible  que  el  error  de  estimation  exceda 
este  margen  de  error,  pero  eso  es  muy  poco  probable. 


CONSEJO 

95%  de  margen  de  error 
1.96  X  error  estandar. 

Las  distribuciones  muestrales  para  dos  estimadores  puntuales  insesgados  se  estudia- 
ron  en  el  capitulo  7.  Se  puede  demostrar  que  estos  dos  estimadores  puntuales  tienen  la 
minima  variabilidad  de  todos  los  estimadores  insesgados  y,  por  lo  tanto,  son  los  mejores 
estimadores  que  se  pueden  hallar  en  cada  situation. 


ESTIMACION  PUNTUAL  DEL  PARAMETRO 
DE  UNA  POBLACION 

•  Estimador  puntual:  estadistica  calculada  usando  mediciones  muestrales 

•  95%  de  margen  de  error:  1.96  X  error  estandar  del  estimador 
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E  J  E  M  P  L 


La  variabilidad  del  estimador  se  mide  usando  este  error  estandar.  No  obstante,  usted 
podra  haber  observado  que  el  error  estandar  suele  depender  de  parametros  desconoci- 
dos,  por  ejemplo  cro p.  Estos  parametros  deben  estimarse  usando  estadisticas  muestrales 
como  son  syp.  Aun  cuando  no  exactamente  correcto,  por  lo  general  los  experimentado- 
res  se  refieren  al  error  estandar  estimado  como  el  error  estandar. 


ENTRENADOR  PERSONAL 

^Corno  estimo  una  media  o  proportion  poblacional? 

•  Para  estimar  la  media  poblacional  p  para  una  poblacion  cuantitativa,  el  esti¬ 
mador  puntual  x  es  insesgado  con  el  error  estandar  estimado  como 


SE  = 


s  t 

Vn 


El  95%  de  margen  de  error  cuando  n  >  30  se  estima  como 

±L96(tfe) 

•  Para  estimar  la  proportion  poblacional  p  para  una  poblacion  binomial,  el  esti¬ 
mador  puntual  p  =  x/n  es  insesgado,  con  un  error  estandar  estimado  como 

SE  =  M 


El  95%  de  margen  de  error  se  estima  como 
±1.96  M 


Suposiciones:  np  >  5  y  nq  >  5. 


Un  ambientalista  esta  realizando  un  estudio  del  oso  polar,  especie  que  se  encuentra  en  el 
oceano  Artico  y  sus  alrededores.  Su  zona  de  distribution  esta  limitada  por  la  existencia 
de  hielo  en  el  mar,  que  usan  como  plataforma  para  cazar  focas,  principal  sosten  de  los 
osos.  La  destruction  de  su  habitat  en  el  hielo  del  Artico,  que  se  ha  atribuido  al  calenta- 
miento  global,  amenaza  la  supervivencia  de  los  osos  como  especie;  puede  extinguirse 
antes  de  un  siglo.1  Una  muestra  aleatoria  de  n  =  50  osos  polares  produjo  un  peso  prome- 
dio  de  980  libras  con  una  desviacion  estandar  de  105  libras.  Use  esta  information  para 
estimar  el  peso  promedio  de  todos  los  osos  polares  del  Artico. 


Solucion  La  variable  aleatoria  medida  es  el  peso,  una  variable  aleatoria  cuantitativa 
mejor  descrita  por  su  media  p..  La  estimation  puntual  de  p,,  el  peso  promedio  de  todos 
los  osos  polares  del  Artico,  es  x  =  980  libras.  El  margen  de  error  se  estima  como 


1.96  SE  =  1.96^= 


29.10  ~  29  libras 


1  Cuando  se  muestrea  a  partir  de  una  distribucion  normal,  (x  —  /jb)/(s/Vn )  tiene  una  distribucion  t,  que  se  estudia- 
ra  en  el  capitulo  10.  Cuando  la  muestra  es  grande ,  este  estadistico  se  encuentra  distribuido  normalmente  en  forma 
aproximada  si  la  poblacion  muestreada  es  normal  o  no  normal. 
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Se  puede  tener  confianza  en  que  la  estimacion  muestral  de  980  libras  esta  a  no  mas  de 
±  29  libras  de  la  media  poblacional. 


A1  reportar  resultados  de  una  investigacion,  es  frecuente  que  los  investigadores  agre- 
guen  ya  sea  la  desviacion  muestral  estandar  .v  (a  veces  llamada  SD)  o  el  error  estandar 
s/Vn  (por  lo  general  llamado  SE  o  SEM)  a  las  estimaciones  de  medias  poblacionales. 
Siempre  se  debe  buscar  una  explication  en  el  texto  del  informe  que  diga  si  el  investiga- 
dor  esta  informando  x  ±  SD  o  x  ±  SE.  Ademas.  las  medias  muestrales  y  desviaciones 
estandar  o  errores  estandar  se  presentan  como  “barras  de  error”  usando  el  formato  gra- 
fico  que  se  ve  en  la  figura  8.5. 


FIGURA  8.5 

Grafica  de  medias  de 
tratamientoysus  errores 
estandar 


15  - 


10  - 


5  - 


SE 


SE 


Tratamientos 


Ademas  del  peso  promedio  del  oso  polar  del  Artico,  el  ambientalista  del  ejemplo  8.4 
tambien  esta  interesado  en  las  opiniones  de  adultos  sobre  el  tema  del  calentamiento 
global.  En  particular,  desea  estimar  la  proporcion  de  personas  que  piensan  que  el  calen¬ 
tamiento  global  es  un  problema  muy  serio.  En  una  muestra  aleatoria  de  n  =  100  adultos, 
73%  de  la  muestra  indicaron  que,  de  lo  que  han  oido  o  leido,  el  calentamiento  global 
es  un  problema  muy  serio.  Estime  la  verdadera  proporcion  de  poblacion  de  adultos  que 
piensan  que  el  calentamiento  global  es  un  problema  muy  serio  y  encuentre  el  margen  de 
error  para  la  estimacion. 

Solution  El  parametro  de  interes  es  ahora  p,  la  proporcion  de  personas  en  la  pobla¬ 
cion  que  piensan  que  el  calentamiento  global  es  un  problema  muy  serio.  El  mejor  esti- 
mador  de  p  es  la  proporcion  muestral  p,  que  para  esta  muestra  es  p  =  .73.  Para  hallar  el 
margen  de  error,  usted  puede  aproximar  el  valor  de  p  con  su  estimacion  p  =  .73: 


1.96  SE  =  1.96 


/.73(.27) 
V  100 


=  .09 


Con  este  margen  de  error,  se  puede  estar  bastante  cierto  de  que  la  estimacion  de  .73 
esta  dentro  de  ±  .09  del  verdadero  valor  de  p.  En  consecuencia,  se  puede  concluir  que 
el  verdadero  valor  de  p  podrfa  ser  de  solo  .64  o  de  hasta  .82.  Este  margen  de  error  es 
bastante  grande  cuando  se  compare  con  la  estimacion  misma  y  refleja  el  hecho  de  que 
se  requiere  de  muestras  grandes  para  alcanzar  un  pequeno  margen  de  error  cuando  se 
estime  p. 
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TABLA  8.1  Algunos  valores  calculados  de  \  pq 


p 

pq 

Vpq 

P 

pq 

VP9 

.1 

.09 

.30 

.6 

.24 

.49 

.2 

.16 

.40 

.7 

.21 

.46 

.3 

.21 

.46 

.8 

.16 

.40 

.4 

.24 

.49 

.9 

.09 

.30 

.5 

.25 

.50 

La  tabla  8.1  muestra  la  forma  en  que  el  numerador  del  error  estandar  de p cambia  para 
diversos  valores  de  p.  Observe  que,  para  casi  todos  los  valores  de  p,  en  especial  cuando 
p  esta  entre  .3  y  .7,  hay  muy  poco  cambio  en  \fpq,  el  numerador  del  SE,  que  alcanza  su 
maximo  valor  cuando  p  =  .5.  Esto  significa  que  el  margen  de  error  usando  el  estima- 
dor  p  tambien  sera  maximo  cuando  p  =  .5.  Cuando  estiman  p,  algunos  entrevistadores 
rudnariamente  usan  el  margen  maximo  de  error,  que  a  veces  recibe  el  nombre  de  error 
muestrale,  en  cuyo  caso  calculan 


1 .96  SE  =  1 .96  o  a  veces  2  SE  =  2 

Las  encuestas  Gallup,  Elarris  y  Roper  generalmente  usan  tamanos  muestrales  de  alrede- 
dor  de  1000,  de  modo  que  su  margen  de  error  es 


1.96  \  =  '  °  sea  alrededor  de  3% 

En  este  caso,  se  dice  que  la  estimacion  esta  dentro  de  ±3  puntos  porcentuales  de  la  ver- 
dadera  proporcion  de  poblacion. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

8.1  Explique  lo  que  significa  “margen  de  error”  en 
estimacion  puntual. 


8.6  Consulte  el  ejercicio  8.5.  <,Que  efecto  tiene 
un  tamano  muestral  aumentado  sobre  el  margen 
de  error? 


8.2  ^Cuales  son  dos  caracterfsticas  del  mejor  estimador 
puntual  para  un  parametro  poblacional? 

8.3  Calcule  el  margen  de  error  al  estimar  una  media 
poblacional  /x  para  estos  valores: 

a.  n  =  30,  cr2  =  .2 

b.  n  =  30,  a2  =  .9 

c.  n  =  30,  a2  =  1.5 

8.4  Consulte  el  ejercicio  8.3.  7,  Que  efecto  tiene  una 
mayor  varianza  poblacional  sobre  el  margen  de  error? 

8.5  Calcule  el  margen  de  error  al  estimar  una  media 
poblacional  /x  para  estos  valores: 

a.  n  =  50,  s2  =  4 

b.  n  =  500,  s2  =  4 

c.  n  =  5000,  s2  =  4 


8.7  Calcule  el  margen  de  error  al  estimar  una 
proporcion  binomial  para  cada  uno  de  los  siguientes 
valores  de  n.  Use  p  =  .5  para  calcular  el  error  estandar 
del  estimador. 

a.  n  =  30  b.  n  =  100 

c.  n  =  400  d .  n  =  1000 

8.8  Consulte  el  ejercicio  8.7.  (.Quc  efecto  tiene  aumentar 
el  tamano  muestral  sobre  el  margen  de  error? 

8.9  Calcule  el  margen  de  error  al  estimar  una  proporcion 
binomial  p  usando  muestras  de  tamano  n  =  100  y  los 
siguientes  valores  para  p: 

a.  p  =  .1  b.  p  =  .3  c.  p  =  .5 

d.  p  =  .7  e.  p  =  .9 

f.  <',Cual  de  los  valores  de  p  produce  el  maximo  margen 
de  error? 
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8.10  Suponga  que  esta  usted  escribiendo  un  cuestionario 
para  una  encuesta  muestral  que  comprende  n  =  1 00 
individuos.  El  cuestionario  va  a  generar  estimaciones 
para  varias  proporciones  binomiales  diferentes.  Si  desea 
informar  un  solo  margen  de  error  para  la  encuesta,  (,que 
margen  de  error  del  ejercicio  8.9  es  el  correcto  para  usar? 

8.1 1  Una  muestra  aleatoria  de  n  =  900  observaciones 
de  entre  una  poblacion  binomial  produjo  x  =  655  exitos. 
Estime  la  proporcion  binomial  p  y  calcule  el  margen  de 
error. 

8.12  Una  muestra  aleatoria  de  n  =  50  observaciones 
de  entre  una  poblacion  cuantitativa  produjo  x  =  56.4  y 
s2  =  2.6.  De  la  mejor  estimacion  puntual  para  la  media 
poblacional  p,  y  calcule  el  margen  de  error. 

APLICACIONES 

8.13  La  falla  de  San  Andres  Unos  geologos  estan 
interesados  en  corrimientos  y  movimientos  de  la 
superficie  terrestre  indicados  por  fracturas  (grietas)  de  la 
corteza  de  nuestro  planeta.  Una  de  las  fracturas  grandes 
mas  famosas  es  la  falla  de  San  Andres,  en  California. 

Una  geologa  que  trata  de  estudiar  el  movimiento  de  los 
cambios  relativos  en  la  corteza  terrestre,  en  un  lugar  en 
particular,  encontro  numerosas  fracturas  en  la  estructura 
local  de  rocas.  En  un  intento  por  determinar  el  angulo 
medio  de  las  roturas,  ella  muestreo  n  =  50  fracturas  y 
encontro  que  la  media  muestral  y  desviacion  estandar 
eran  de  39.8°  y  17.2°,  respectivamente.  Estime  la 
direction  angular  media  de  las  fracturas  y  encuentre  el 
margen  de  error  para  su  estimacion. 

8.14  Biomasa  Las  estimaciones  de  la  biomasa 
de  la  Tierra,  es  decir,  la  cantidad  total  de  vegetation 
que  hay  en  los  bosques  del  planeta,  son  importantes 
para  determinar  la  cantidad  de  dioxido  de  carbono  no 
absorbido  que  se  espera  permanezca  en  la  atmosfera 
terrestre.2  Suponga  que  una  muestra  de  75  terrenos  de  un 
metro  cuadrado,  escogidos  al  azar  en  bosques  boreales 
de  America  del  Norte,  produjo  una  biomasa  media  de 
4.2  kilogramos  por  metro  cuadrado  (kg/m2),  con  una 
desviacion  estandar  de  1 .5  kg/m2.  Estime  el  promedio  de 
biomasa  para  los  bosques  boreales  de  America  del  Norte 
y  encuentre  el  margen  de  error  para  su  estimacion. 

Fuente:  Reimpreso  con  permiso  de  Science  News,  publication  semanal  de  Science, 
copyright  1 989  por  Science  Services,  Inc. 

8.15  Confianza  del  consumidor  Un  aumento  en  la  tasa 
de  ahorros  del  consumidor  esta  con  frecuencia  relacionado 
con  la  falta  de  confianza  en  la  economfa  y  se  dice  que  es  un 
indicador  de  una  tendencia  a  la  recesion  de  la  economfa. 

Un  muestreo  aleatorio  de  n  =  200  cuentas  de  ahorro  en  una 
comunidad  local  mostro  un  aumento  medio  en  valores  de 
cuentas  de  ahorro  de  7.2%  en  los  ultimos  12  meses,  con  una 


desviacion  estandar  de  5.6%.  Estime  el  aumento  medio  en 
porcentaje  en  valores  de  cuentas  de  ahorros  de  los  ultimos 
12  meses  para  depositantes  de  esta  comunidad.  Encuentre 
el  margen  de  error  para  su  estimacion. 

8.16  Ninos  multimedia  ^Nuestros  hijos  pasan  el 
mismo  tiempo,  disfrutando  de  actividades  al  aire  fibre  y 
jugando  con  la  familia  y  amigos,  que  las  generaciones 
previas?  O  bien,  ^nuestros  hijos  pasan  cada  vez  mas 
tiempo  frente  a  un  televisor,  computadora  y  otros  equipos 
multimedia?  Una  muestra  aleatoria  de  250  ninos  entre 
ocho  y  18  anos  de  edad  mostro  que  170  ninos  tenfan  un 
televisor  en  su  recamara  y  120  de  ellos  tenfan  tambien 
un  juego  de  video. 

a.  Estime  la  proporcion  de  todos  los  ninos  y 
adolescentes,  de  ocho  a  1 8  anos,  que  tienen  un 
televisor  en  sus  recamaras  y  calcule  el  margen  de  error 
de  su  estimacion. 

b.  Estime  la  proporcion  de  todos  los  ninos  y 
adolescentes,  de  ocho  a  18  anos,  que  tienen  un  juego 
de  video  en  sus  recamaras  y  calcule  el  margen  de 
error  de  su  estimacion. 

8. 1 7  Inmigracion  legal  En  un  tiempo  en  la  historia  de 
Estados  Unidos,  cuando  parece  haber  una  preocupacion 
genuina  por  el  numero  de  inmigrantes  ilegales  que 
viven  en  ese  pafs,  tambien  parece  haber  preocupacion 
por  el  numero  de  inmigrantes  legales  a  los  que  se 

les  permite  entrar  al  pafs.  En  una  encuesta  reciente 
que  incluyo  preguntas  acerca  de  inmigrantes  legales 
e  ilegales,  51%  de  los  n  =  900  votantes  registrados 
entrevistados  indicaron  que  se  deberfa  reducir  el  numero 
de  inmigrantes  legales  que  entraran  a  Estados  Unidos.3 

a.  (\CiiaI  es  la  estimacion  puntual  para  la  proporcion  de 
votantes  registrados  en  Estados  Unidos,  que  piensan 
que  se  deberfa  reducir  el  numero  de  inmigrantes  que 
entran  a  Estados  Unidos?  Calcule  el  margen  de  error. 

b.  La  encuesta  informa  de  un  margen  de  error  de 
±  3%.  (',En  que  forma  fue  calculado  el  margen 

de  error  publicado  para  que  se  pueda  aplicar  a  todas 
las  preguntas  de  la  encuesta? 

8.18  Vacaciones  de  verano  Uno  de  los  principals 
costos  en  unas  vacaciones  planeadas  es  el  del 
alojamiento.  Incluso  dentro  de  una  cadena  particular  de 
hoteles,  los  costos  pueden  variar  considerablemente 
dependiendo  del  tipo  de  cuarto  y  comodidades  ofrecidas.4 
Suponga  que  al  azar  escogemos  50  facturas  de  cada  una 
de  las  bases  de  datos  computarizadas  de  las  cadenas  de 
hoteles  Marriott,  Radisson  y  Wyndham,  y  registramos  las 
tarifas  de  un  cuarto  por  noche. 

Marriott  Radisson  Wyndham 

Promedio  muestral  $170  $145  $150 

Desviacion  estandar  muestral  17.5  10  16.5 
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a.  Describa  la(s)  poblacion(es)  muestreada(s). 

b.  Encuentre  una  estimacion  puntual  para  el  promedio 
de  tarifa  por  cuarto  para  la  cadena  de  hoteles  Marriott. 
Calcule  el  margen  de  error. 

c.  Encuentre  una  estimacion  puntual  para  el  promedio  de 
tarifa  por  cuarto  para  la  cadena  de  hoteles  Radisson. 
Calcule  el  margen  de  error. 

d.  Encuentre  un  estimador  puntual  para  el  promedio  de 
tarifa  por  cuarto  para  la  cadena  de  hoteles  Wyndham. 
Calcule  el  margen  de  error. 

e.  Presente  graficamente  los  resultados  de  los  incisos 
b),  c)  y  d),  usando  la  forma  que  se  ve  en  la 
figura  8.5.  Use  estas  graficas  para  comparar  el 
promedio  de  tarifas  por  cuarto  para  las  tres  cadenas 
de  hoteles. 

8.19  Numeros  "900"  Es  frecuente  que  estaciones  de 
radio  y  television  transmitan  asuntos  controversiales 
durante  el  tiempo  de  transmision  y  pidan  a  su  auditorio 
indiquen  su  acuerdo  o  desacuerdo  con  una  opinion  sobre 
el  asunto.  Se  realiza  una  encuesta  solicitando  a  personas 
del  auditorio  que  estan  de  acuerdo  llamen  a  cierto 
numero  telefonico  900  y  a  quienes  no  estan  de  acuerdo 
que  llamen  a  otro  numero  telefonico  900.  Todos  los  que 
contestan  pagan  una  cuota  por  sus  llamadas. 

a.  (,  La  tecnica  de  la  encuesta  resulta  en  una  muestra 
aleatoria? 

b.  ^Que  se  puede  decir  acerca  de  la  validez  de  los 
resultados  de  esa  encuesta?  ,',Alguien  tiene  que 
preocuparse  por  un  margen  de  error  en  este  caso? 


8.20  iHombres  en  Marte?  Los  vehiculos  gemelos  en 
Marte,  Spirit  y  Opportunity,  que  vagaron  por  la  superficie 
de  Marte  hace  varios  anos,  encontraron  evidencia  de  que 
una  vez  hubo  agua  en  Marte,  elevando  la  posibilidad  de 
que  hubiera  vida  en  el  planeta.  ^Piensa  usted  que  Estados 
Unidos  deberfa  proseguir  un  programa  para  enviar  seres 
humanos  a  Marte?  Una  encuesta  de  opiniones  realizada 
por  la  Associated  Press  indico  que  49%  de  los  1034 
adultos  encuestados  piensan  que  se  deberfa  continuar  con 
ese  programa.5 

a.  Estime  la  verdadera  proportion  de  estadounidenses 
que  piensan  que  Estados  Unidos  deberfa  continuar 
con  un  programa  para  enviar  seres  humanos  a  Marte. 
Calcule  el  margen  de  error. 

b.  La  pregunta  planteada  en  el  inciso  a)  fue  solo  una  de 
otras  muchas  respecto  a  nuestro  programa  espacial 
que  se  formularon  en  la  encuesta  de  opiniones.  Si 

la  Associated  Press  deseaba  informar  de  un  error 
muestral  que  serfa  valido  para  toda  la  encuesta,  ^que 
valor  deberfan  publicar? 

8.21  Ratas  hambrientas  En  un  experimento  para 
evaluar  la  intensidad  del  instinto  del  hambre  en  ratas, 

30  animales  previamente  entrenados  fueron  privados  de 
alimento  durante  24  horas.  A1  termino  de  ese  periodo, 
cada  rata  fue  puesta  en  una  j  aula  donde  se  les  dio  alimento 
si  el  animal  presionaba  una  palanca.  Para  cada  animal, 

se  registro  el  tiempo  en  el  que  continuaba  presionando 
la  barra  (aun  cuando  no  recibiera  alimento).  Si  los  datos 
dieron  una  media  muestral  de  19.3  minutos  con  una 
desviacion  estandar  de  5.2  minutos,  estime  el  verdadero 
tiempo  medio  y  calcule  el  margen  de  error. 


ESTIMACION  DE  INTERVALO 

Un  estimador  de  intervalo  es  una  regia  para  calcular  dos  numeros,  por  ejemplo  a  y  b, 
para  crear  un  intervalo  del  que  usted  esta  completamente  seguro  que  contiene  el  para- 
metro  de  interes.  El  concepto  de  “completamente  seguro”  significa  “con  gran  probabi- 
lidad”.  Medimos  esta  probabilidad  usando  el  coeficiente  de  confianza,  designado  por 


CONSEJO 


1  —  a. 


Def  inicion  La  probabilidad  de  que  un  intervalo  de  confianza  contenga  el  parametro 
estimado  se  denomina  coeficiente  de  confianza. 


estimacion  de  intervalo  = 
lazo. 


Por  ejemplo,  es  frecuente  que  los  experimentadores  construyan  intervalos  de  confianza 
de  95%,  lo  cual  significa  que  el  coeficiente  de  confianza,  o  la  probabilidad  de  que  el 
intervalo  contenga  el  parametro  estimado,  sea  .95.  Se  puede  aumentar  o  reducir  la  can- 
tidad  de  certeza  si  se  cambia  el  coeficiente  de  confianza.  Algunos  valores  que  por  lo 
general  usan  experimentadores  son  .90,  .95,  .98  y  .99. 

Considere  una  analogfa,  esta  vez  lanzar  un  lazo  a  un  poste  de  una  cerca.  El  poste  de  la 
cerca  representa  el  parametro  que  se  desea  estimar  y  el  lazo  formado  por  la  cuerda  repre- 
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senta  el  intervalo  de  confianza.  Cada  vez  que  se  lance  la  cuerda,  se  espera  lazar  al  poste 
de  la  cerca;  no  obstante,  a  veces  falla  el  lazo.  En  alguna  forma,  cada  vez  que  se  saque  una 
muestra  y  construya  un  intervalo  de  confianza  para  un  parametro,  usted  espera  incluir 
el  parametro  en  su  intervalo,  pero,  al  igual  que  el  lazo,  a  veces  falla.  Su  “porcentaje  de 
exito”,  es  decir  la  proportion  de  intervalos  que  “lazan  al  poste”  en  muestreo  repetido,  es 
el  coeficiente  de  confianza. 

Construccion  de  un  intervalo  de  confianza 

Cuando  la  distribution  muestral  de  un  estimador  puntual  es  aproximadamente  normal, 
se  puede  construir  un  estimador  de  intervalo  o  intervalo  de  confianza  mediante  el 
siguiente  razonamiento.  Para  mayor  sencillez,  suponga  que  el  coeficiente  de  confianza 
es  .95  y  consulte  la  figura  8.6. 


Parametro  ±  1.96  SE 


•  Sabemos  que,  de  todos  los  valores  posibles  del  estimador  que  podrfamos  selec- 
cionar,  95%  de  ellos  estaran  en  el  intervalo 

Parametro  ±  1.96  SE 

que  se  ve  en  la  figura  8.6. 

•  Como  el  valor  del  parametro  es  desconocido,  considere  construir  el  intervalo 

estimador  ±  1.96  SE 

que  tiene  el  mismo  ancho  que  el  primer  intervalo,  pero  tiene  un  centro  variable. 

•  (.Con  que  frecuencia  este  intervalo  funcionara  en  forma  correcta  y  encerrara  el 
parametro  de  interes?  Consulte  la  figura  8.7. 


www.FreeLibros.me 


8.5  ESTIMACION  DE INTERVALO  O  309 


CONSEJO 


Al  igual  que  en  un  juego 
de  lanzar  un  anillo: 


parametro  =  estaquilla 
estimacion  de  intervalo  = 
anillo. 


Los  primeros  dos  intervalos  funcionan  correctamente,  es  decir,  el  parametro  (marcado 
con  una  linea  punteada)  esta  contenido  dentro  de  ambos  intervalos.  El  tercer  intervalo 
no  funciona,  porque  no  encierra  al  parametro.  Esto  ocurrio  porque  el  valor  del  estimador 
del  centro  del  intervalo  estaba  demasiado  lejos  del  parametro.  Por  fortuna,  valores  del 
estimador  solo  caen  a  esa  distancia  5%  del  tiempo  y  nuestro  procedimiento  funcionara 
en  forma  correcta  95%  del  tiempo. 

Si  se  desea,  se  puede  cambiar  el  coeficiente  de  confianza  de  (1  —  a)  =  .95  a  otro  nivel 
de  confianza  (1  —  a).  Para  lograr  esto,  es  necesario  cambiar  el  valor  z  —  1.96,  que  loca- 
liza  un  area  de  .95  en  el  centro  de  la  curva  normal  estandar,  a  un  valor  de  z  que  localice 
el  area  (1  —  a )  en  el  centro  de  la  curva,  como  se  ve  en  la  figura  8.8.  Como  el  area  total 
bajo  la  curva  es  1 ,  el  area  restante  en  las  dos  colas  es  a  y  cada  cola  contiene  un  area  all. 
El  valor  de  z  que  tiene  “area  de  cola”  all  a  su  derecha  se  denomina  zan,  y  el  area  entre 
— Zan  y  Za/2 es  el  coeficiente  de  confianza  (1  —  a).  Valores  de  z„/2,  que  por  lo  general  son 
utilizados  por  experimentadores,  a  usted  le  seran  familiares  cuando  empiece  a  construir 
intervalos  de  confianza  para  diferentes  situaciones  practicas.  Algunos  de  estos  valores 
se  dan  en  la  tabla  8.2. 


INTERVALO  DE  CONFIANZA  DE  MUESTRA 
GRANDE  (1  -  «)100% 

(Estimador  puntual)  ±  z,an  X  (error  estandar  del  estimador) 

donde  Zan  es  el  valor  z  con  un  area  all  en  la  cola  derecha  de  una  distribucion  normal 
estandar.  Esta  formula  genera  dos  valores;  el  limite  inferior  de  confianza  (LCL)  y 
el  limite  superior  de  confianza  (UCL). 


Valores  de  z  que  comunmente  se  usan  para  intervalos  de  confianza 

Coeficiente 
de  confianza 


(1  -  a) 

a 

a/ 2 

Za/2 

.90 

.10 

.05 

1.645 

.95 

.05 

.025 

1.96 

.98 

.02 

.01 

2.33 

.99 

.01 

.005 

2.58 
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Intervalo  de  confianza  de  muestra  grande 
para  una  media  poblacional  /jl 

Es  muy  frecuente  que  problemas  practicos  lleven  a  /jl,  la  media  de  una  poblacion  de 
mediciones  cuandtadvas.  He  aquf  algunos  ejemplos: 

•  El  promedio  de  calidcaciones  de  estudiantes  universitarios  en  una  universidad 
particular 

•  El  promedio  de  resistencia  de  un  nuevo  tipo  de  acero 

•  El  numero  promedio  de  fallecimientos  por  categorfa  de  edad 

•  El  promedio  de  demanda  para  un  nuevo  producto  de  cosmetico 

Cuando  el  tamano  muestral  n  sea  grande,  la  media  muestral  x.  es  el  mejor  estimador  pun- 
tual  para  la  media  poblacional  /jl.  Como  su  distribucion  muestral  es  aproximadamente 
normal,  puede  usarse  para  construir  un  intervalo  de  confianza  de  acuerdo  con  el  metodo 
general  dado  ya  antes. 


UN  INTERVALO  DE  CONFIANZA  DE  MUESTRA 
GRANDE  (1  -  a)1 00%  PARA  UNA  MEDIA 
POBLACIONAL  /i 


donde  z.„n  es  el  valor  z  correspondiente  a  un  area  a/2  en  la  cola  superior  de  una 
distribucion  z  normal  estandar  y 

n  =  tamano  muestral 

er  =  desviacion  estandar  de  la  poblacion  muestreada 

Si  a  es  desconocida,  puede  ser  aproximada  por  la  desviacion  estandar  muestral 
s  cuando  el  tamano  muestral  sea  grande  (n  >  30)  y  el  intervalo  aproximado  de 
confianza  es 


Otra  forma  de  hallar  el  intervalo  de  confianza  de  muestra  grande  para  una  media 
poblacional  /jl  es  empezar  con  la  estadfstica 


x  —  /JL 


a/Vn 


que  tiene  una  distribucion  normal  estandar.  Si  escribimos  zan  como  el  valor  de  z  con  area 
a/2  a  su  derecha,  entonces  se  puede  escribir 


Esta  desigualdad  se  puede  reescribir  como 


-X  -Za/2- ¥=  <  ~  fX<  ~  X  +  Za/2-7= 

Vn  Vn 
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de  modo  que 

~  4a/2^=  <  p  <  X  +  Z«l2r^=J  =  1  -  OL 

Los  terminos  x  —  zan(o'/Vn)  yx  +  Zani&lVn),  que  son  los  lfmites  inferior  y  superior  de 
confianza,  son  en  realidad  cantidades  aleatorias  que  dependen  de  la  media  muestral  x. 
Por  tanto,  en  muestreo  repetido,  el  intervalo  aleatorio  x  ±  Zcdiio'/Vn),  contendra  la  me¬ 
dia  poblacional  p  con  probabilidad  (1  —  a). 

Un  cientifico  interesado  en  vigilar  contaminantes  qufmicos  en  alimentos  y,  por  lo  tanto, 
la  acumulacion  de  contaminantes  en  la  dieta  humana,  selecciono  una  muestra  aleatoria 
de  n  =  50  adultos  hombres.  Se  encontro  que  el  promedio  de  ingesta  diaria  de  produc- 
tos  lacteos  fue  de  .7  =  756  gramos  por  dfa,  con  una  desviacion  estandar  de  5  =  35  gramos 
por  dia.  Use  esta  informacion  muestral  para  construir  un  intervalo  de  confianza  de  95% 
para  la  ingesta  diaria  media  de  productos  lacteos  para  hombres. 

Soluc  Como  el  tamano  muestral  de  n  =  50  es  grande,  la  distribucion  de  la  media 
muestral  x  esta  distribuida  normalmente  en  forma  aproximada,  con  media  p.  y  error 
estandar  estimado  por  sVn.  El  intervalo  de  confianza  aproximado  de  95%  es 


x  ±  1.96 


756  ±  1.96 


756  ±  9.70 


Un  intervalo  de  confianza 
de  95%  nos  dice  que,  si 
fueramos  a  construir  muchos 
de  estos  intervalos  (todos 
los  cuales  tendrian  puntos 
extremos  ligeramente 
diferentes),  95%  de 
ellos  encierran  la  media 
poblacional. 


Por  tanto,  el  intervalo  de  confianza  de  95%  para  p,  es  de  746.30  a  765.70  gramos  por 
dia. 


Interpretation  del  intervalo  de  confianza 

('.Que  significa  decir  que  estamos  “95%  ciertos”  que  el  valor  real  de  la  media  poblacional 
p.  esta  dentro  de  un  intervalo  determinado?  Si  fueramos  a  construir  20  de  esos  intervalos, 
cada  uno  usando  diferente  informacion  muestral,  nuestros  intervalos  podrfan  verse  como 
los  de  la  figura  8.9.  De  los  20  intervalos,  podrfa  esperarse  que  95%  de  ellos,  o  sea  19 
de  cada  20,  funcionaran  como  se  planea  y  contienen  p.  dentro  de  sus  lfmites  superior  e 
inferior. 


FIGURA  8.9 

Veinte  intervalos  de 
confianza  para  la  media 
del  ejemplo  8.6 


a 

2 


20 

16 

12 

8 

4 
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Recuerde  que  no  se  puede  estar  absolutamente  seguro  de  que  algun  intervalo  particular 
contenga  la  media  p.  Nunca  se  sabra  si  ese  intervalo  particular  es  uno  de  los  19  que 
“funcionaron”,  o  si  es  el  intervalo  que  “faltaba”.  La  confianza  en  el  intervalo  estimado 
proviene  del  hecho  de  que  cuando  se  calculan  intervalos  repetidos,  95%  de  esos  inter¬ 
vals  contendran  /x. 


Usted  puede  tratar  este  experimento  por  si  mismo  usando  el  applet  Java  llamado 
Interpreting  Confidence  Intervals  (Interpretacion  de  los  intervalos  de  con¬ 
fianza).  El  applet  que  se  muestra  en  la  figura  8. 10a)  muestra  el  calculo  de  un  intervalo 
de  confianza  de  95%  para  p  cuando  n  =  50  y  cr  =  35.  Para  este  intervalo  particu¬ 
lar  de  confianza,  usamos  el  boton  One  Sample  ( Una  Muestra).  Se  puede  ver  el  valor 
de  p  como  una  linea  vertical  verde  en  su  pantalla  (gris  en  la  figura  8.10).  Observe  que 
este  intervalo  de  confianza  funciono  correctamente  y  encerro  la  linea  vertical  entre 
sus  limites  superior  e  inferior.  La  figura  8.10b)  muestra  el  calculo  de  100  de  esos 
intervalos,  usando  el  boton  100  Samples.  Los  intervalos  que  no  funcionan  correcta¬ 
mente  se  ven  en  rojo  en  su  pantalla  (negro  en  la  figura  8.10).  ^Cuantos  intervalos  no 
funcionan?  ^Es  cerca  del  95%  de  confianza  que  decimos  tener?  El  usuario  empleara 
este  applet  de  nuevo  para  la  seccion  de  ejercicios  Mi  Applet  al  final  del  capitulo. 


FIGURA  8.1  O 

Applet  Interpreting 
Confidence  Intervals 
(Interpretacion  de  los 
intervalos  de  confianza) 


95%  Cl  for  the  Population  Mean,  n 

Data: 

713  781  685  728  756  74; 

759  693  807  763  776  366 
766  822  724  792  766  778 
774  816  738  740  778  750 
721  722  725  747  684  717 


x-bar  =  753.9 
sigma  =  35.0 
n  =50 

sigma/SqRooti'n)  =  4.95 

2=1.96  for  alpha/2  =  0.025 

lowerCI  =  753.94  -  1 .96(4.95) 
upperCI  =  753.94+  1.96(4.95; 


95%  Cl  for  the  Population  Mean,  n  =  50 
Cl  Includes  Mean  for 9,5%  of  These  Samples 


'  803  788  714  760  773 
737  775  770  705  723 
750  800  735  748  726 
761  797  740  706  783 


=  744.0 
=  764.0 


a) 


Un  buen  intervalo  de  confianza  tiene  dos  caracteristicas  deseables: 

•  Es  tan  angosto  como  es  posible.  Cuanto  mas  angosto  sea  el  intervalo,  mas  exacta- 
mente  se  habra  localizado  el  parametro  estimado. 

•  Tiene  un  coeficiente  de  confianza  grande,  cercano  a  1.  Cuanto  mayor  sea  el 
coeficiente  de  confianza,  es  mas  probable  que  el  intervalo  contenga  el  parametro 
estimado. 


ejemplo  8.7  Construya  un  intervalo  de  confianza  de  99%  para  la  ingesta  diaria  media  de  productos 

lacteos  para  los  hombres  adultos  del  ejemplo  8.6. 
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Solucion  Para  cambiar  el  nivel  de  confianza  a  .99  se  debe  hallar  el  valor  apropiado 
de  la  z  normal  estandar  que  pone  el  area  (1  —  a)  =  .99  en  el  centra  de  la  curva.  Este  valor, 
con  area  de  cola  all  =  .005  a  su  derecha,  se  encuentra  de  la  tabla  8.2  como  z  =  2.58 
(vease  la  figura  8.1 1).  El  intervalo  de  confianza  de  99%  es  entonces 


x  ±  2.58 


756  ±  2.58(4.95) 
756  ±  12.77 


o  sea,  743.23  a  768.77  gramos  por  dfa.  Este  intervalo  de  confianza  es  mas  ancho  que  el 
intervalo  de  confianza  de  95%  del  ejemplo  8.6. 


FIGURA  8.1  1 

Valores  estandar  normales 
para  un  intervalo  de 
confianza  de  99% 


CONSEJO 


Area  de  cola 
derecha 

Valor  z 

.05 

1.645 

.025 

1.96 

.01 

2.33 

.005 

2.58 

El  ancho  aumentado  es  necesario  para  aumentar  la  confianza,  igual  que  como  se  desearfa 
un  anillo  mas  ancho  en  su  lazo  para  asegurarse  de  lazar  el  poste  de  una  cerca.  La  unica 
forma  de  aumentar  la  confianza  sin  aumentar  el  ancho  del  intervalo  es  aumentar  el 
tamafio  muestral,  n. 


El  error  estandar  de  x, 


mide  la  variabilidad  o  dispersion  de  los  valores  de  x.  Cuanto  mas  variables  sean  los  datos 
poblacionales,  medidos  por  er,  mas  variable  sera  x  y  cl  error  estandar  sera  mas  grande. 
Por  otra  parte,  si  se  aumenta  el  tamano  muestral  n,  habra  mas  informacion  para  estimar 
fx.  Las  estimaciones  deben  caer  mas  cerca  de  /j.  y  el  error  estandar  sera  mas  pequeno. 
Se  puede  usar  el  applet  Exploring  Confidence  Intervals  (Exploracion  de  intervalos 
de  confianza),  que  se  muestra  en  la  figura  8.12,  para  ver  el  efecto  de  cambiar  el  tamano 
muestral  n,  la  desviacion  estandar  er  y  el  coeficiente  de  confianza  1  —  a  en  el  ancho  del 
intervalo  de  confianza. 

Los  intervalos  de  confianza  de  los  ejemplos  8.6  y  8.7  son  aproximados  porque  se  sus- 
tituyo  s  como  una  aproximacion  para  er.  Esto  es,  en  lugar  de  que  el  coeficiente  de  con¬ 
fianza  sea  .95,  el  valor  especificado  en  el  ejemplo,  el  verdadero  valor  del  coeficiente  puede 
ser  .92,  .94  o  .97.  Pero  esta  discrepancia  es  de  poco  interes  desde  un  punto  de  vista 
practico;  en  lo  que  se  refiere  a  la  “confianza”  del  usuario,  hay  poca  diferencia  entre 
estos  coeficientes  de  confianza.  Casi  todos  los  estimadores  que  se  emplean  en  estadfstica 
dan  intervalos  aproximados  de  confianza,  porque  las  suposiciones  sobre  las  que  estan 
basadas  no  se  satisfacen  exactamente.  Habiendo  visto  este  punto,  no  continuaremos  refi- 
riendonos  a  intervalos  de  confianza  como  “aproximados”.  Es  de  poco  interes  practico 
mientras  el  coeficiente  real  de  confianza  sea  cercano  al  valor  especificado. 
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Intervalo  de  confianza  de  muestra  grande 
para  una  proporcion  poblacional  p 

Muchos  experimentos  de  investigation  o  estudios  muestrales  tienen  como  objetivo  la 
estimacion  de  la  proportion  de  personas  u  objetos  de  un  grupo  grande,  que  posean  cierta 
caracteristica.  Veamos  algunos  ejemplos: 

•  La  proportion  de  ventas  que  se  puede  esperar  en  un  gran  niimero  de  contactos  de 
clientes 

•  La  proportion  de  semillas  que  germinan 

•  La  proportion  de  votantes  “probables”  que  planean  votar  para  un  candidato  poli¬ 
tico  particular 

Cada  uno  es  un  ejemplo  practico  del  experimento  binomial  y  el  parametro  a  estimarse 
es  la  proporcion  binomial  p. 

Cuando  el  tamano  muestral  es  grande,  la  proporcion  muestral, 

f.  _  x  _  Numero  total  de  exitos 
n  Niimero  total  de  intentos 

es  el  mejor  estimador  puntual  para  la  proporcion  poblacional  p.  Como  su  distribution 
muestral  es  aproximadamente  normal,  con  media  p  y  error  estandar  SE  =  \Jpq/n, 
p  puede  usarse  para  construir  un  intervalo  de  confianza  de  acuerdo  al  metodo  general 
dado  en  esta  section. 


UN  INTERVALO  DE  CONFIANZA  DE  MUESTRA 
GRANDE  (1  -  a)1 00%  PARA  UNA  PROPORCION 
POBLACIONAL  p 


donde  Zan  es  el  valor  z  correspondiente  a  un  area  de  all  en  la  cola  derecha  de  una 
distribution  normal  z.  Como  py  q  son  incognitas,  se  estiman  con  el  uso  de  los  me- 
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jores  estimadores  puntuales:  p  y  q.  El  tamano  muestral  se  considera  grande  cuando 
la  aproximacion  normal  a  la  distribucion  binomio  es  adecuada,  es  decir,  cuando 
np  >  5  y  nq  >  5. 

Una  muestra  aleatoria  de  985  “probables”  electores,  o  sea  los  que  probablemente  voten 
en  la  proxima  eleccion,  fueron  encuestados  durante  un  maraton  telefonico  realizado  por 
el  Partido  Republicano.  De  ellos,  592  indicaron  que  tenfan  la  intencion  de  votar  por  la 
candidata  republicana.  Construya  un  intervalo  de  confianza  de  90%  para  p.  la  proporcion 
de  electores  probables  de  la  poblacion  que  tienen  la  intencion  de  votar  por  la  candidata 
republicana.  Con  base  en  esta  information,  ^se  puede  concluir  que  la  candidata  ganara 
la  eleccion? 

Solucion  La  estimacion  puntual  para  p  es 


y  el  error  estandar  es 


El  valor  z  para  un  intervalo  de  confianza  de  90%  es  el  valor  que  tiene  area  de  all  =  .05 
en  la  cola  superior  de  la  distribucion  z,  o  z.05  =  1 .645  de  la  tabla  8.2.  El  intervalo  de 
confianza  del  90%  para  p  es  entonces 


.601  ±  .026 

o  sea  .575  <  p  <  .627 .  Se  estima  que  el  porcentaje  de  probables  electores  que  tienen 
intencion  de  votar  por  la  candidata  republicana  es  entre  57.5%  y  62.7%.  La  candidata 
ganara  la  eleccion?  Suponiendo  que  ella  necesita  mas  del  50%  de  los  votos  para  ganar,  y 
como  los  lfmites  superior  e  inferior  de  confianza  exceden  de  este  valor  mfnimo,  se  puede 
decir  con  90%  de  confianza  que  la  candidata  ganara. 


Hay  algunos  problemas,  no  obstante,  con  este  tipo  de  encuesta  muestral.  (iQue  pasa  si 
los  electores  que  se  consideran  a  sf  mismos  “probables  para  votar”  en  realidad  no  van  a 
las  casillas?  <;Que  pasa  si  un  elector  cambia  de  idea  entre  ahora  y  el  dfa  de  la  eleccion? 
(iQue  pasa  si  un  elector  entrevistado  no  responde  fielmente  cuando  el  trabajador  de  la 
campana  le  hace  preguntas?  El  intervalo  de  confianza  de  90%  que  ha  construido  le  da 
90%  de  confianza  solo  si  ha  seleccionado  una  muestra  aleatoria  de  entre  la  poblacion 
de  interes.  Ya  no  se  puede  estar  seguro  de  “90%  de  confianza”  si  su  muestra  es  sesgada, 
o  si  la  poblacion  de  respuestas  de  votantes  cambia  antes  del  dfa  de  la  eleccion. 

Es  posible  que  usted  hay  a  observado  que  el  estimador  puntual  con  su  95%  de  margen 
de  error  se  ve  muy  semejante  a  un  intervalo  de  confianza  de  95%  para  el  mismo  parame- 
tro.  Esta  cercana  relation  existe  para  casi  todos  los  parametros  estimados  en  este  libro, 
pero  no  es  verdadera  en  general.  A  veces  el  mejor  estimador  puntual  para  un  parametro 
no  cae  en  la  mitad  del  mejor  intervalo  de  confianza;  el  mejor  intervalo  de  confianza 
puede  no  ser  siquiera  una  funcion  del  mejor  estimador  puntual.  Aun  cuando  esta  es  una 
distincion  teorica,  debe  recordarse  que  hay  una  diferencia  entre  estimacion  puntual  y 
estimacion  de  intervalo,  y  que  la  eleccion  entre  las  dos  depende  de  la  preferencia  del 
experimentador. 
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EJERCICIOS 


TECNICAS  BASICAS 

8.22  Encuentre  e  interprete  un  intervalo  de  confianza  de 
95%  para  una  media  poblacional  /x  para  estos  valores: 

a.  n  =  36,*  =  13.1,  s2  =  3.42 

b.  n  =  64,*  =  2.73,  s2  =  .1047 

8.23  Encuentre  un  intervalo  de  confianza  de  90%  para 
una  media  poblacional  /x  para  estos  valores: 

a.  n  =  125,  *  =  .84,  s2  =  .086 

b.  n  =  50. 3c  =  21.9,  ,S'2  =  3.44 

c.  Interprete  los  intervalos  hallados  en  los  incisos  a)  y  b). 

8.24  Encuentre  un  intervalo  de  confianza  (1  —  a)100% 
para  una  media  poblacional  /x  para  estos  valores: 

a.  a  =  .01,  n  =  38,  *  =  34,  s2  =  12 

b.  a  =  .10,  n  =  65,*  =  1049,  i2  =  51 

c .  a  =  .05,  n  =  89,  x  =  66.3,  s 2  =  2.48 

8.25  Una  muestra  aleatoria  de  n  =  300  observaciones 
de  una  poblacion  binomial  produjo  x  =  263  exitos. 
Encuentre  un  intervalo  de  confianza  de  90%  para  p  e 
interprete  el  intervalo. 

8.26  Suponga  que  el  numero  de  exitos  observado  en 
n  =  500  intentos  de  un  experimento  binomial  es  27. 
Encuentre  un  intervalo  de  confianza  de  95%  para  p. 

(iPor  que  el  intervalo  de  confianza  es  mas  angosto  que 
el  intervalo  de  confianza  del  ejercicio  8.25? 

8.27  Una  muestra  aleatoria  de  n  mediciones  se 
selecciona  de  una  poblacion  con  /x  media  desconocida 

y  desviacion  estandar  a  =  10  conocida.  Calcule  el  ancho 
de  un  intervalo  de  confianza  de  95%  para  /x  para  estos 
valores  de  n: 

a.  n  =  100  b.  n  =  200  c.  n  =  400 

8.28  Compare  los  intervalos  de  confianza  del  ejercicio 
8.27.  ,/Que  efecto  dene  cada  una  de  estas  acciones  sobre 
el  ancho  de  un  intervalo  de  confianza? 

a.  Duplique  el  tamano  muestral 

b.  Cuadruplique  el  tamano  muestral 

8.29  Consulte  el  ejercicio  8.28. 

a.  Calcule  el  ancho  de  un  intervalo  de  confianza  de  90% 
para  /x  cuando  n  =  100. 

b.  Calcule  el  ancho  de  un  intervalo  de  confianza  de  99% 
para  p,  cuando  n  =  100. 

c.  Compare  los  anchos  de  intervalos  de  confianza 
de  90%,  95%  y  99%  para  /x.  ^Que  efecto  tiene  un 
creciente  coeficiente  de  confianza  sobre  el  ancho  del 
intervalo  de  confianza? 


APLICACIONES 

8.30  Un  experimento  de  quimica  Debido  a  una 
variation  en  tecnicas  de  laboratorio,  impurezas  en 
materiales  y  otros  factores  desconocidos,  los  resultados 
de  un  experimento  en  un  laboratorio  de  quimica  no 
siempre  daran  la  misma  respuesta  numerica.  En  un 
experimento  de  electrolisis,  un  grupo  de  estudiantes 
midio  la  cantidad  de  cobre  precipitado  de  una  solucion 
saturada  de  sulfato  de  cobre  en  un  periodo  de  30  minutos. 
Los  n  =  30  estudiantes  calcularon  una  media  muestral 

y  desviacion  estandar  igual  a  .145  y  .0051  moles, 
respectivamente.  Encuentre  un  intervalo  de  confianza  de 
90%  para  la  cantidad  media  de  cobre  precipitado  de  la 
solucion  en  un  periodo  de  30  minutos. 

8.31  Lluvia  acida  La  lluvia  acida,  causada  por  la 
reaccion  de  ciertos  contaminantes  del  aire  con  el  agua 
de  lluvia,  parece  ser  un  problema  creciente  en  la  region 
noreste  de  Estados  Unidos.  (La  lluvia  acida  afecta 

al  suelo  y  causa  corrosion  en  superficies  metalicas 
expuestas.)  La  lluvia  pura  que  cae  en  aire  limpio  registra 
un  valor  de  pH  de  5.7  (el  pH  es  una  medida  de  la  acidez: 

0  es  acido;  14  es  alcalino).  Suponga  que  muestras  de  agua 
de  40  lluvias  se  analizan  para  el  contenido  del  pH  yxys 
son  iguales  a  3.7  y  .5,  respectivamente.  Encuentre  un 
intervalo  de  confianza  de  99%  para  el  pH  medio  en  agua 
de  lluvia  e  interprete  el  intervalo.  (iQue  suposicion  debe 
hacerse  para  que  el  intervalo  de  confianza  sea  valido? 

8.32  Reproductores  MP3  /  Tiene  usted  un  iPod 
Nano  o  un  Walkman  Bean  Sony?  Estas  y  otras  marcas 
de  reproductores  MP3  estan  haciendose  cada  vez  mas 
populares  entre  los  jovenes  estadounidenses.  Un  estudio 
acerca  de  los  iPod  indico  que  54%  de  los  jovenes  entre  12 
y  17  anos  de  edad,  30%  de  entre  18  y  34  anos  y  13%  de 
entre  35  y  54  anos  tienen  reproductores  MP3.6  Suponga 
que  estas  tres  estimaciones  estan  basadas  en  muestras 
aleatorias  de  tamanos  400,  350  y  362,  respectivamente. 

a.  Construya  una  estimacion  de  intervalo  de  confianza  de 
95%  para  la  proporcion  de  personas  entre  12  y  17  anos 
que  tienen  un  reproductor  MP3. 

b.  Construya  una  estimacion  de  intervalo  de  confianza  de 
95%  para  la  proporcion  de  personas  entre  18  y  34  anos 
que  tienen  un  reproductor  MP3. 

8.33  Carne  para  hamburguesa  El  departamento 

de  carnes  de  una  cadena  local  de  supermercados  empaca 
carne  molida  usando  charolas  de  dos  tamanos:  una 
disenada  para  contener  alrededor  de  1  libra  de  carne 
y  otra  que  contiene  aproximadamente  3  libras.  Una 
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muestra  aleatoria  de  35  paquetes  en  las  charolas  mas 
pequenas  para  came  produjo  mediciones  de  peso  con 
un  promedio  de  1.01  libras  y  una  desviacion  estandar 
de  .18  libras. 

a.  Construya  un  intervalo  de  confianza  de  99%  para  el 
peso  promedio  de  todos  los  paquetes  vendidos  por  esta 
cadena  de  supermercados  en  las  charolas  de  carne  mas 
pequenas. 

b.  ^Que  significa  la  frase  “99%  de  confianza”? 

c.  Suponga  que  el  departamento  de  control  de  calidad 
de  esta  cadena  de  supermercados  tiene  la  intention  de 
que  la  cantidad  de  carne  molida  en  las  charolas 

mas  pequenas  debe  ser  1  libra  en  promedio.  (jEI 
intervalo  de  confianza  del  inciso  a  debe  ser  del  interes 
del  departamento  de  control  de  calidad?  Explique. 

8.34  Abortos  legates  Los  resultados  de  una  encuesta 
del  Newsweek  respecto  a  puntos  de  vista  sobre  el  aborto 
dados  en  el  ejercicio  7.66  mostro  que  de  n  =  1002 
adultos,  39%  favorecieron  la  postura  del  “derecho  a 

la  vida”,  en  tanto  que  53%  estuvieron  “a  favor  de  la 
eleccion  libre”.7  La  encuesta  reporto  un  margen  de  error 
de  mas  o  menos  3%. 

a.  Construya  un  intervalo  de  confianza  de  90%  para  la 
proporcion  de  adultos  que  estan  a  favor  de  la  postura 
del  “derecho  a  la  vida”. 

b.  Construya  un  intervalo  de  confianza  de  90%  para  la 
proporcion  de  adultos  que  estan  “a  favor  de  la  eleccion 
libre”. 

8.35  Los  SUV  (monovolumen)  Una  encuesta 
muestral  esta  disenada  para  estimar  la  proporcion 
de  vehfculos  utilitarios  deportivos  (llamados  SUV  o 
monovolumen)  en  el  estado  de  California.  Una  muestra 
aleatoria  de  500  registros  se  selecciona  de  una  base  de 
datos  del  Departamento  de  Vehiculos  de  Motor  y  68  se 
clasifican  como  vehiculos  utilitarios  deportivos. 

a.  Use  un  intervalo  de  confianza  de  95%  para  estimar 
la  proporcion  de  vehfculos  utilitarios  deportivos  en 
California. 

b.  <',C6mo  se  puede  estimar  la  proporcion  de  vehfculos 
utilitarios  deportivos  en  California,  con  un  grado  mas 
alto  de  precision?  (sugerencia:  Hay  dos  respuestas.) 

8.36  Compras  electronical  En  un  informe  de 
por  que  los  compradores  por  internet  abandonan  sus 
transacciones  de  ventas  en  lfnea,  Alison  Stein  Wellner8 
encontro  que  las  “paginas  tardaban  demasiado  en 


cargarse”  y  “el  sitio  era  tan  confuso  que  no  pude  hallar 
el  producto”  eran  las  dos  quejas  que  mas  se  escucharon. 
Con  base  en  respuestas  de  compradores,  el  tiempo 
promedio  para  completar  un  formato  de  pedido  en 
lfnea  toma  4.5  minutos.  Suponga  que  n  =  50  clientes 
respondieron  y  que  la  desviacion  estandar  del  tiempo 
para  completar  un  pedido  en  lfnea  es  de  2.7  minutos. 

a.  ^Piensa  usted  que  x,  el  tiempo  para  completar  el 
formato  de  pedido  en  lfnea,  tiene  una  distribucion 
en  forma  de  montfculo?  Si  no  es  asf,  ('C]iic  forma 
esperarfa? 

b.  Si  la  distribucion  de  los  tiempos  para  completar 
el  formato  no  es  normal,  todavfa  se  puede  usar 
la  distribucion  normal  estandar  para  construir  un 
intervalo  de  confianza  para  /x,  el  tiempo  medio  de 
completar  para  compradores  en  lfnea.  (iPor  que? 

c.  Construya  un  intervalo  de  confianza  de  95%  para  /x,  el 
tiempo  medio  de  completar  par  pedidos  en  lfnea. 

8.37  ^Que  es  normal?  ^Que  es  normal,  cuando 
se  trata  de  temperaturas  corporales  de  personas?  Una 
muestra  aleatoria  de  130  temperaturas  corporales 
humanas,  dadas  por  Allen  Shoemaker9  en  la  Journal  of 
Statistical  Education,  tenfa  una  media  de  98.25  grados  y 
una  desviacion  estandar  de  0.73  grados. 

a.  Construya  un  intervalo  de  confianza  de  99%  para  la 
temperatura  corporal  promedio  de  personas  sanas. 

b.  El  intervalo  de  confianza  construido  en  el  inciso  a) 
contiene  el  valor  de  98.6  grados,  que  es  la 
temperatura  promedio  usual  citada  por  medicos  y 
otros  especialistas?  Si  no  es  asf,  (;que  conclusiones  se 
pueden  sacar? 

8.38  Sacudiendo  el  voto  f,Que  tan  probable  es  que 
usted  vote  en  la  siguiente  eleccion  presidencial?  Se  tomo 
una  muestra  aleatoria  de  300  adultos,  y  192  de  ellos 
dijeron  que  siempre  votan  en  elecciones  presidenciales. 

a.  Construya  un  intervalo  de  confianza  de  95%  para  la 
proporcion  de  adultos  estadounidenses  que  dicen  que 
siempre  votan  en  elecciones  presidenciales. 

b.  Un  artfculo  en  American  Demographics  reporta 
este  porcentaje  de  67%. 10  Con  base  en  el  intervalo 
construido  en  el  inciso  a),  ^estarfa  usted  en  desacuerdo 
con  ese  porcentaje  presentado?  Explique. 

c.  (.Podemos  usar  la  estimacion  de  intervalo  del 
inciso  a),  para  estimar  la  proporcion  real  de 
adultos  estadounidenses  que  votaron  en  la  eleccion 
presidencial  de  2008?  ^Por  que  sf  o  por  que  no? 
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ESTIMACION  DE  LA  DIFERENCIA 
ENTRE  DOS  MEDIAS  POBLACIONALES 

Un  problema  de  igual  importancia  que  la  estimacion  de  una  sola  media  poblacional  /jl, 
para  una  poblacion  cuantitativa,  es  la  comparacion  de  dos  medias  poblacionales.  Usted 
puede  hacer  comparaciones  como  estas: 


•  Las  calificaciones  promedio  del  examen  de  admision  para  el  colegio  medico 
(MCAT)  para  estudiantes  cuya  especializacion  fuera  bioqmmica,  y  para  aquellos 
cuya  especializacion  fuera  biologfa 

•  Las  producciones  promedio  en  una  planta  qufmica  que  usa  materias  primas  sumi- 
nistradas  por  dos  proveedores  diferentes 

•  El  promedio  de  diametros  de  tallos  de  plantas  crecidas  con  dos  tipos  diferentes  de 
nutrientes 


Para  cada  uno  de  estos  ejemplos,  hay  dos  poblaciones:  la  primera  con  media  y  varianza 
Mi  y  0i,  y  la  segunda  con  media  y  varianza  /x2  y  ar\.  Una  muestra  aleatoria  de  «,  medi- 
ciones  se  saca  de  la  poblacion  1  y  una  segunda  muestra  aleatoria  de  tamano  n2  se  saca  de 
manera  independiente  de  la  poblacion  2.  Por  ultimo,  las  estimaciones  de  los  parametros 
poblacionales  se  calculan  a  partir  de  los  datos  muestrales  usando  los  estimadores  xh  s\ 
x2  y  s\,  como  se  ve  en  la  tabla  8.3. 


tabla  8.3  Muestras  de  dos  poblaciones  cuantitativas 

Poblacion  1  Poblacion  2 

Media  /x,  /x2 

Varianza  cr]  a\ 


Tamano  muestral  1 

Tamano  muestral  2 

Media 

x, 

x2 

Varianza 

•Tl 

4 

Muestra 

n  1 

n2 

Intuitivamente,  la  diferencia  entre  dos  medias  muestrales  darfa  la  maxima  informa- 
cion  acerca  de  la  diferencia  real  entre  dos  medias  poblacionales  y  este  es  de  hecho  el 
caso.  El  mejor  estimador  puntual  de  la  diferencia  (/Xi  —  i±2)  entre  las  medias  poblaciona¬ 
les  es  Xi  —  x2.  La  distribucion  muestral  de  este  estimador  no  es  dificil  de  deducir,  pero  la 
expresamos  aquf  sin  demostracion. 


PROPIEDADES  DE  LA  DISTRIBUCION  MUESTRAL 
DE  (X,  -  x2),  LA  DIFERENCIA  ENTRE  DOS 
MEDIAS  MUESTRALES 

Cuando  muestras  aleatorias  independientes  de  n  t  y  n2  observaciones  han  sido 
seleccionadas  de  entre  poblaciones  con  medias  Mi  y  M2  y  varianzas  cri  y  a\, 
respectivamente,  la  distribucion  muestral  de  la  diferencia  (x{  —  x2)  tiene  las  siguien- 
tes  propiedades: 

1 .  La  media  de  ( 3c  1  —  x2)  es 
Mi  ~  M2 
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y  el  error  estandar  es 


SE  = 


°1 

n2 


que  se  puede  estimar  como 


I  J  1 

SE  =  J—  +  —  cuando  los  tamanos  muestrales  son  grandes. 

2.  Si  las  poblaciones  muestreadas  estan  distribuidas  normalmente,  entonces 

la  distribucion  muestral  de  (x,  —  x2)  esta  distribuida  normalmente  exactamente, 
cualquiera  que  sea  el  tamano  muestral. 

3.  Si  las  poblaciones  muestreadas  no  estan  distribuidas  normalmente,  entonces 
la  distribucion  muestral  de  (xt  —  x2)  esta  distribuida  normalmente  aproxima- 
damente  cuando  nt  y  n2  son  ambas  de  30  o  mas,  debido  al  teorema  del  limite 
central. 

Como  (yu-!  —  yu,2)  es  la  media  de  la  distribucion  muestral,  se  deduce  que  Qc,  —  x2)  es 
un  estimador  insesgado  de  (/x,  —  /jl2)  con  una  distribucion  aproximadamente  normal 
cuando  nx  y  n2  son  grandes.  Esto  es,  el  estadfstico 

(II  ~  X2)  ~  (fXj  -  (X2) 

z  = 

tiene  una  distribucion  z  normal  aproximadamente  estandar  y  los  procedimientos  genera- 
les  de  la  seccion  8.5  se  pueden  usar  para  construir  estimaciones  puntuales  y  de  intervalo. 
Aun  cuando  la  eleccion  entre  estimacion  puntual  y  de  intervalo  depende  de  la  preferen- 
cia  personal  del  usuario,  casi  todos  los  experimentadores  escogen  construir  intervalos  de 
confianza  para  problemas  de  dos  muestras.  Las  formulas  apropiadas  para  ambos  meto- 
dos  se  dan  a  continuation. 


CONSEJO 


Area  de  cola 
derecha 

Valor  z 

.05 

1.645 

.025 

1.96 

.01 

2.33 

.005 

2.58 

ESTIMACION  PUNTUAL  DE  (/rn  -  /x2) 
DE  MUESTRA  GRANDE 

Estimador  puntual:  (5,  —  x2)  , - 

95%  margen  de  error:  ±  1.96  SE  =  ±  1.96Jjjj  +  jq 


UN  INTERVALO  DE  CONFIANZA  DE  MUESTRA 
GRANDE  DE  (1  -  a)100%  PARA  (/x,  -  /r2) 

Is?  sF 

(xi  -  *2)  ±  Zed 2]jjq  +  jq 

Las  resistencias  al  desgaste  de  dos  tipos  de  llantas  para  automovil  se  compararon  en 
muestras  de  pruebas  en  camino  de  nx  =  n2  =  100  llantas  para  cada  tipo.  El  numero  de 
millas  hasta  el  completo  desgaste  se  definio  como  una  cantidad  especifica  de  desgaste 
de  la  llanta.  Los  resultados  de  la  prueba  se  muestran  en  la  tabla  8.4.  Estime  {\±\  —  /jl2), 
la  diferencia  en  la  media  de  millas  hasta  el  completo  desgaste,  usando  un  intervalo  de 
confianza  de  99%.  H ay  diferencia  en  el  promedio  de  calidad  de  desgaste  para  los  dos 
tipos  de  llantas? 
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TABLA  8.4  Resumen  de  datos  muestrales  para  dos  tipos  de  Mantas 

Llanta  1  Llanta  2 


x,  =  26400  millas  x2  =  25100  millas 

5^  =  1  440000  522  =  1  960000 


Solucion  La  estimation  puntual  de  (p.  —  p,2)  es 
(x,  —  x2 )  =  26400  —  25  100  =  1300  millas 
y  el  error  estandar  de  (x,  —  x2)  se  estima  como 


SE 


^ \  J2  ,1440000  +  1960000 

Wi  +  n~_=\  100  100 


184.4  millas 


El  intervalo  de  confianza  de  99%  se  calcula  como 

I  s2  ?2 

(*!  “  *2)  ±  2-58M  +  W2 

1300  ±  2.58(184.4) 

1300  ±  475.8 


Si  0  no  es  el  intervalo,  se 
puede  concluir  que  hay  una 
diferencia  en  las  medias 
poblacionales. 


o  sea  824.2  <  {jj,x  —  /jl2)  <  1775.8.  La  diferencia  en  el  promedio  de  millas  hasta  el  com¬ 
plete  desgaste  para  los  dos  tipos  de  llantas  se  estima  que  esta  entre  el  limite  inferior 
LCL  =  824.2  y  el  limite  superior  UCL  =  1775.8  millas  de  desgaste. 

Con  base  en  este  intervalo  de  confianza,  ^se  puede  concluir  que  hay  una  diferencia 
en  el  promedio  de  millas  hasta  el  complete  desgaste  para  los  dos  tipos  de  llantas?  Si  no 
hubiera  diferencia  en  las  dos  medias  poblacionales,  entonces  p,[  y  /jl2  serian  iguales  a 
(p.  —  f±2)  =  0.  Si  observamos  el  intervalo  de  confianza  construido,  se  vera  que  0  no 
es  uno  de  los  posibles  valores  para  —  p,2).  Por  tanto,  no  es  probable  que  las  medias 
sean  iguales;  se  puede  concluir  que  hay  una  diferencia  en  el  promedio  de  millas  hasta  el 
completo  desgaste  para  los  dos  tipos  de  llantas.  El  intervalo  de  confianza  ha  permitido 
tomar  una  decision  acerca  de  la  igualdad  de  las  dos  medias  poblacionales. 


El  cientffico  del  ejemplo  8.6  se  preguntaba  si  habfa  diferencia  en  el  promedio  de  ingesta 
diaria  de  productos  lacteos  entre  hombres  y  mujeres.  El  tomo  una  muestra  de  11  =  50 
mujeres  adultas  y  registro  sus  ingestas  diarias  de  productos  lacteos  en  gramos  por  dta. 
Elizo  lo  mismo  con  hombres  adultos.  En  la  tabla  8.5  se  presenta  un  resumen  de  sus 
resultados  muestrales.  Construya  un  intervalo  de  confianza  de  95%  para  la  diferencia 
en  el  promedio  de  ingestas  diarias  de  productos  lacteos  para  hombres  y  mujeres.  pSe 
puede  concluir  que  hay  una  diferencia  en  el  promedio  de  ingestas  diarias  para  hombres 
y  mujeres? 


TABLA  8.5  Valores  muestrales  para  ingestas  diarias  de  productos  lacteos 

Hombres  Mujeres 


Tamano  muestral 

50 

50 

Media  muestral 

756 

762 

Desviacion  estandar  muestral 

35 

30 

www.FreeLibros.me 


8.6  ESTIMACION  DE  LA  DIFERENCIA  ENTRE  DOS  MEDIAS  POBLACIONALES  O  321 


Solucion  El  intervalo  de  confianza  se  construye  usando  un  valor  de  z  con  area  de 
cola  a/2  =  .025  a  su  derecha,  esto  es,  z.025  =  1.96.  Usando  las  desviaciones  muestrales 
estandar  para  aproximar  las  desviaciones  estandar  poblacionales  desconocidas,  el  inter¬ 
valo  de  95%  de  confianza  es 


(x,-x,)±  -96.  U  + 

(756  -  762,  ±  1.96  if  +  f 
-6  ±  12.78 

o  sea  — 18.78  <  (yu,  —  yu,2)  <  6.78.  Veamos  los  posibles  valores  para  (yu-!  —  yu,2)  del  inter¬ 
valo  de  confianza.  Es  posible  que  la  diferencia  (yu,  —  yu,2)  pudiera  ser  negativa  (lo  cual 
indica  que  el  promedio  para  mujeres  excede  del  promedio  para  hombres),  pudiera  ser 
positiva  (lo  cual  indica  que  los  hombres  tienen  el  promedio  mas  alto)  o  pudiera  ser  0 
(lo  cual  indica  que  no  hay  diferencia  entre  los  promedios).  Con  base  en  esta  information, 
no  estariamos  dispuestos  a  concluir  que  hay  una  diferencia  en  el  promedio  de  ingestas 
diarias  de  productos  lacteos  para  hombres  y  mujeres. 


Los  ejemplos  8.9  y  8.10  merecen  mas  comentarios  respecto  a  usar  estimaciones 
muestrales  en  lugar  de  parametros  desconocidos.  La  distribucion  muestral  de 

(*l  ~  X2)  ~  (Mi  ~  yu.2) 


i 

tiene  una  distribucion  normal  estandar  para  todos  los  tamanos  muestrales  cuando  ambas 
poblaciones  muestreadas  son  normales,  y  una  distribucion  normal  estandar  aproximada 
cuando  las  poblaciones  muestreadas  no  sean  normales  pero  los  tamanos  muestrales  sean 
grandes  (>  30).  Cuando  cr\  y  cr2  no  se  conocen  y  son  estimadas  por  las  estimaciones 
muestrales  s\  y  s\,  la  estadistica  resultante  todavfa  tendra  una  distribucion  normal  estan¬ 
dar  aproximada  cuando  los  tamanos  muestrales  sean  grandes.  El  comportamiento  de  esta 
estadistica  cuando  las  varianzas  poblacionales  son  desconocidas,  y  los  tamanos  muestra¬ 
les  sean  pequenos,  se  estudiara  en  el  capitulo  10. 


,2 

°3  I  °2 
«i  n2 


0 


EJERCICIOS 


TECNICAS  BASICAS 

8.39  Muestras  aleatorias  independientes  se 
seleccionaron  de  las  poblaciones  1  y  2.  Los  tamanos 
muestrales,  medias  y  varianzas  son  como  sigue: 

Poblacion 


1  2 


Tamano  muestral  35  49 

Media  muestral  12.7  7.4 

Varianza  muestral  1.38  4.14 


a.  Encuentre  un  intervalo  de  confianza  de  95%  para  esti- 
mar  la  diferencia  en  las  medias  poblacionales  (/x  —  yu,2). 


b.  Con  base  en  el  intervalo  de  confianza  del  inciso  a), 
(:,se  puede  concluir  que  hay  una  diferencia  en  las 
medias  para  las  dos  poblaciones?  Explique. 

8.40  Muestras  aleatorias  independientes  se 
seleccionaron  de  las  poblaciones  1  y  2.  Los  tamanos 
muestrales,  medias  y  varianzas  son  como  sigue: 

Poblacion 


1  2 


Tamano  muestral  64  64 

Media  muestral  2.9  5.1 

Varianza  muestral  0.83  1.67 
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a.  Encuentre  un  intervalo  de  confianza  de  90%  para  la 
diferencia  en  las  medias  poblacionales.  7,  Que  significa 
la  frase  “90%  seguro”? 

b.  Encuentre  un  intervalo  de  confianza  de  99%  para  la 
diferencia  en  las  medias  poblacionales.  ^Se  puede 
concluir  que  hay  una  diferencia  en  las  dos  medias 
poblacionales?  Explique. 

APLICACIONES 

8.41  Selenio  Una  pequena  cantidad  del  oligoelemento 
selenio,  50-200  microgramos  (/xg)  por  dfa,  se  considera 
esencial  para  una  buena  salud.  Suponga  que  muestras 
aleatorias  de  n,  =  n2  =  30  adultos  se  seleccionaron  de 
dos  regiones  de  Estados  Unidos  y  que  la  ingesta  diaria 
de  selenio,  de  liquidos  y  solidos,  se  registro  para  cada 
persona.  La  media  y  desviacion  estandar  de  las  ingestas 
diarias  de  selenio  para  los  30  adultos  de  la  region  1 
fueron  i,  =  167.1  y  .y,  =  24.3  /Jig,  respectivamente. 

Las  estadfsticas  correspondientes  para  los  30  adultos 
de  la  region  2  fueron  x2  =  140.9  y  s2  =  17.6.  Encuentre 
un  intervalo  de  confianza  de  95%  para  la  diferencia  en 
las  ingestas  medias  de  selenio  para  las  dos  regiones. 
Interprete  este  intervalo. 

8.41  9-1-1  Se  realizo  un  estudio  para  comparar  los 
numeros  medios  de  llamadas  de  emergencia  a  la  policfa 
por  turno  de  8  horas  en  dos  distritos  de  una  gran  ciudad. 
Muestras  de  100  turnos  de  8  horas  se  seleccionaron  al 
azar  de  entre  los  registros  policiales  para  cada  una  de  las 
dos  regiones  y  el  numero  de  llamadas  de  emergencia  se 
registro  para  cada  turno.  Las  estadfsticas  muestrales 
se  indican  a  continuation: 

Region 


1  2 


Tamano  muestral  100  100 

Media  muestral  2.4  3.1 

Varianza  muestrai  1.44  2.64 


Encuentre  un  intervalo  de  confianza  de  90%  para  la 
diferencia  en  los  numeros  medios  de  llamadas  de 
emergencia  a  la  policfa  por  turno  entre  los  dos  distritos 
de  la  ciudad.  Interprete  el  intervalo. 

8.43  Ensenando  biologia  Al  desarrollar  un  estandar 
para  evaluar  la  ensenanza  de  ciencias  preuniversitarias  en 
Estados  Unidos,  se  realizo  un  experimento  para  evaluar 
un  curriculum  desarrollado  por  un  maestro,  “Biologia:  un 
contexto  comunitario”  (BACC,  por  sus  siglas  en  ingles) 
basado  en  estandares,  orientado  en  actividades  y  centrado 
en  preguntas.  Este  metodo  fue  comparado  con  la 
presentacion  historica  por  medio  de  lectura,  vocabulario 
y  datos  aprendidos  de  memoria.  Los  estudiantes  fueron 
examinados  en  conceptos  de  biologia  que  destacaban 
conocimientos  biologicos  y  conocimientos  de  proceso 
en  el  sentido  tradicional.  Los  resultados  quiza  no  tan 


sorprendentes  de  un  examen  sobre  conceptos  de  biologia, 
publicados  en  The  American  Biology  Teacher,  se 
muestran  en  la  tabla  siguiente.11 

Tamano  Desviacion 


Media 

muestral 

estandar 

Examen  previo: 

Todos  los  grupos  de  BACC 

13.38 

372 

5.59 

Examen  previo: 

Todos  los  tradicionales 

14.06 

368 

5.45 

Despues  del  examen: 

Todos  los  grupos  de  BACC 

18.5 

365 

8.03 

Despues  del  examen: 

Todos  los  tradicionales 

16.5 

298 

6.96 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
calificacion  media  para  el  examen  previo  para  todos 
los  grupos  de  BACC. 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
calificacion  media  del  examen  previo  para  todos  los 
grupos  tradicionales. 

c.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  calificaciones  medias  para  los  grupos 
BACC  despues  del  examen  y  los  grupos  tradicionales 
despues  del  examen. 

d.  (iEI  intervalo  de  confianza  en  c)  da  evidencia  de  que 
hay  una  diferencia  real  en  las  calificaciones  de  grupo 
tradicional  y  BACC  despues  del  examen?  Explique. 

Fuente:  De  "Performance  Assessment  of  a  Standards-Based  High  School  Biology  Curri¬ 
culum",  por  W.  Leonard,  B.  Speziale  y  J.  Pernick  en  The  American  Biology  Teacher,  2001 , 
63(5),  310-316.  Reimpreso  con  permiso  de  National  Association  of  Biology  Teachers. 

8.44  <iEsta  usted  a  dieta?  Se  realizo  un  experimento 
para  comparar  las  dietas  A  y  B  disenadas  para  bajar  de 
peso.  Se  seleccionaron  al  azar  dos  grupos  de  30  personas 
con  sobrepeso  de  cada  grupo.  Uno  de  los  grupos  fue 
puesto  a  la  dieta  A  y  el  otro  a  la  B  y  se  registraron  sus 
bajas  de  peso  en  un  periodo  de  30  dfas.  Las  medias  y 
desviaciones  estandar  de  las  mediciones  de  baja  de  peso 
para  los  dos  grupos  se  muestran  en  la  tabla.  Encuentre 
un  intervalo  de  confianza  de  95%  para  la  diferencia  en 
reduction  media  de  peso  para  las  dos  dietas.  Interprete  su 
intervalo  de  confianza. 

Dieta  A  Dieta  B 

JO,  =  21 .3  xB=13.4 

sA  =  2.6  Sb  =  1 .9 

8.45  Salarios  iniciales  Los  graduados  universitarios 
estan  obteniendo  mas  de  sus  tftulos  al  aumentar  los  salarios 
iniciales.  Para  comparar  los  salarios  iniciales  de  graduados 
universitarios  que  se  especializan  en  ingenierfa  quhnica 

y  ciencias  computacionales,  se  seleccionaron  muestras 
aleatorias  de  50  graduados  universitarios  recientes  en  cada 
especializacion  y  se  obtuvo  la  siguiente  information. 

Especializacion  Media  SD 

Ingenierfa  qufmica  $53659  2225 

Ciencias  computacionales  51  042  2375 
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8.6  estimacionde  la  diferencia  entre  dos  medias  poblacionales  o  323 


a.  Encuentre  una  estimation  puntual  para  la  diferencia 
en  salarios  iniciales  de  estudiantes  universitarios 
que  se  especializan  en  ingenierfa  qufmica  y  ciencias 
computacionales.  (',Cual  es  el  margen  de  error  en  la 
estimation  de  usted? 

b.  Con  base  en  los  resultados  del  inciso  a),  (ipiensa 
usted  que  hay  una  diferencia  importante  en  salarios 
iniciales  para  ingenieros  qufmicos  y  de  ciencias 
computacionales?  Explique. 

8.46  Conocimientos  de  biologia  Consulte  el 
ejercicio  8.43.  Ademas  de  examenes  que  comprenden 
conceptos  de  biologia,  los  estudiantes  tambien  fueron 
examinados  en  conocimientos  de  procesos.  Los 
resultados  de  examenes  previos  y  calificaciones  despues 
del  examen,  publicados  en  The  American  Biology 
Teacher,  se  dan  a  continuation.11 


Media 

Tamano 

muestral 

Desviacion 

estandar 

Examen  previo: 

Todos  los  grupos  BACC 

10.52 

395 

4.79 

Examen  previo: 

Todos  los  tradicionales 

11.97 

379 

5.39 

Despues  de  examen: 

Todos  los  grupos  BACC 

14.06 

376 

5.65 

Despues  de  examen: 

Todos  los  tradicionales 

12.96 

308 

5.93 

a.  Encuentre  un  intervalo  de  confianza  del  95%  de  la 
puntuacion  media  en  habilidades  del  proceso  para 
despues  del  examen  para  todos  los  grupos  BACC. 

b.  Encuentre  un  intervalo  de  confianza  del  95%  de  la 
puntuacion  media  en  habilidades  del  proceso  para 
despues  del  examen  para  todos  los  grupos  tradicionales. 

c.  Encuentre  un  intervalo  de  confianza  del  95%  para  la 
diferencia  en  las  puntuaciones  medias  en  habilidades 
del  proceso  para  despues  del  examen  para  los  grupos 
BACC  y  los  tradicionales. 

d.  (',E1  intervalo  de  confianza  de  c)  proporciona 
evidencia  de  que  hay  una  diferencia  real  en  las 
puntuaciones  medias  de  las  habilidades  del  proceso 
despues  del  examen  entre  los  grupos  BACC  y  los 
tradicionales?  Explique. 

Fuente:  De  "Performance  Assessment  of  a  Standards-Based  High  School  Biology  Curri¬ 
culum",  por  W.  Leonard,  B.  Speziale  y  J.  Pernick  en  The  American  Biology  Teacher,  2001 , 
63(5),  310-316.  Reimpreso  con  permiso  de  National  Association  of  Biology  Teachers. 

8  7  Costos  de  hoteles  Consulte  el  ejercicio  8.18. 
Las  medias  y  desviaciones  estandar  para  50  facturaciones 
de  cada  una  de  las  bases  de  datos  de  cada  una  de  las  tres 
cadenas  de  hoteles  se  dan  en  la  tabla:4 

Marriott  Radisson  Wyndham 

Promedio  muestral  $170  $145  $160 

Desviacion  muestral  estandar  17.5  10  16.5 


a.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  el  promedio  de  tarifas  de  cuartos  para 
las  cadenas  hoteleras  Marriott  y  Wyndham. 

b.  Encuentre  un  intervalo  de  99%  de  confianza  para  la 
diferencia  en  el  promedio  de  tarifas  de  cuartos  para  las 
cadenas  hoteleras  Radisson  y  Wyndham. 

c.  7,Los  intervalos  de  los  incisos  a)  y  b)  contienen  el 
valor  (yu-i  —  i-L2)  =  0?  <',Por  que  es  esto  de  interes  para 
el  investigador? 

d.  (',Los  datos  indican  una  diferencia  en  el  promedio  de 
tarifas  de  cuartos  de  hotel  entre  las  cadenas  Marriott 
y  la  Wyndham?  ^  Entre  las  cadenas  Radisson  y  la 
Wyndham? 

8.48  Ruido  y  estres  Para  comparer  el  efecto  del  estres 
en  la  forma  de  ruido  sobre  la  capacidad  de  realizar  un 
trabajo  sencillo,  70  personas  fueron  divididas  en  dos 
grupos.  El  primer  grupo  de  30  personas  actuo  como 
control,  en  tanto  que  el  segundo  grupo  de  40  fueron  el 
grupo  experimental.  Aun  cuando  cada  persona  realizo 

el  trabajo  en  el  mismo  cuarto  de  control,  cada  una  de 
las  personas  del  grupo  experimental  tuvo  que  realizar 
el  trabajo  cuando  se  reproducfa  musica  de  rock  a  alto 
volumen.  El  tiempo  para  terminar  el  trabajo  se  registro 
para  cada  individuo  y  se  obtuvo  el  siguiente  resumen: 

Control  Experimental 

n  30  40 

x  15minutos  23minutos 

s  4minutos  lOminutos 

a.  Encuentre  un  intervalo  de  confianza  de  99%  para  la 
diferencia  en  tiempos  medios  de  termination  para 
estos  dos  grupos. 

b.  Con  base  en  el  intervalo  de  confianza  del  inciso  a), 

7,  hay  suficiente  evidencia  para  indicar  una  diferencia 
en  el  tiempo  promedio  de  termination  para  los  dos 
grupos?  Explique. 

8.49  iQue  es  normal?,  continua  De  las  130  personas 
del  ejercicio  8.37,  65  eran  mujeres  y  65  eran  hombres.9 
Las  medias  y  desviacion  estandar  de  sus  temperaturas  se 
muestran  a  continuation. 

Hombres  Mujeres 

Media  muestral  98.11  98.39 

Desviacion  estandar  0.70  0.74 

Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  el  promedio  de  temperaturas  corporales 
para  hombres  contra  mujeres.  Con  base  en  este  intervalo, 
7,se  puede  concluir  que  hay  una  diferencia  en  el 
promedio  de  temperaturas  para  hombres  contra  mujeres? 
Explique. 
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ESTIMACION  DE  LA  DIFERENCIA  ENTRE 
DOS  PROPORCIONES  BINOMIALES 


Una  simple  extension  de  la  estimacion  de  una  proporcion  binomial  p  es  la  estimacion  de 
la  diferencia  entre  dos  proporciones  binomiales.  Se  pueden  hacer  comparaciones  como 
estas: 

•  La  proporcion  de  articulos  defectuosos  manufacturados  en  dos  lineas  de  produc- 
cion 

•  La  proporcion  de  votantes  mujeres  y  la  proporcion  de  votantes  hombres  que  estan 
a  favor  de  una  enmienda  de  iguales  derechos 

•  Los  porcentajes  de  germination  de  semillas  no  tratadas  y  semillas  tratadas  con  un 
fungicida 

Estas  comparaciones  pueden  hacerse  con  la  diferencia  (p{  —  p2)  entre  dos  proporciones 
binomiales,  p{  y  p2.  Muestras  aleatorias  independientes  formadas  por  nt  y  n2  intentos  se 
sacan  de  poblaciones  1  y  2,  respectivamente,  y  se  calculan  las  estimaciones  muestrales 
Pi  y  p2.  El  estimador  insesgado  de  la  diferencia  (p,  —  p2)  es  la  diferencia  muestral 
( Pi  ~  Pi)- 


PROPIEDADES  DE  LA  DISTRIBUCION  MUESTRAL 
DE  LA  DIFERENCIA  (pn  -  p2)  ENTRE  DOS 
PROPORCIONES  MUESTRALES 

Suponga  que  las  muestras  aleatorias  independientes  de  las  observaciones  n,  y  n2  han 
sido  seleccionadas  de  poblaciones  binomiales  con  parametros  /;  y  p2,  respectiva¬ 
mente.  La  distribucion  muestral  de  la  diferencia  entre  proporciones  muestrales 


tiene  estas  propiedades: 

1 .  La  media  de  {pi  —  p 2)  es 
Pi  ~  Pi 

y  el  error  estandar  es 


que  se  estima  como 


2.  La  distribucion  muestral  de  (pi  —  p2)  puede  ser  aproximada  por  una  distribucion 
normal  cuando  tii  y  n2  son  grandes,  debido  al  teorema  del  lfmite  central. 

Aun  cuando  el  margen  de  una  proporcion  individual  es  de  0  a  1 ,  la  diferencia  entre 
dos  proporciones  va  de  —  1  a  1 .  Para  usar  una  distribucion  normal  para  aproximar  la 
distribucion  de  ( pt  —  p2),  tanto  /),  como  p2  deben  ser  aproximadamente  normales;  esto 
es,  riipi  >  5,  tiiqi  >  5  y  n2p2  >  5,  n2q2  >  5. 

Las  formulas  apropiadas  para  estimacion  puntual  y  de  intervalo  se  dan  a  conti- 
nuacion. 
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E  J  E  M  P  L 


TABLA  8.6 


ESTIMACION  PUNTUAL  DE  MUESTRA  GRANDE 
DE  (pi  -  p2) 

Estimador  puntual:  ( p,  —  p2) 

95%  de  margen  de  eiTor:  ±  1.96  SE  =  ±  1 .96^  -  +  -~^L~ 


UN  INTERVALO  DE  CONFIANZA  DE  MUESTRA 
GRANDE  (1  -  a)1 00%  PARA  (p,  -  p2) 


(Pi 


Pi)  ±  Za/2 


|Pi£ i  ,  IMl 
n,  ~n2 


Suposicion:  nt  y  n2  deben  ser  suficientemente  grandes  para  que  la  distribucion 
muestral  de  (px  —  p2)  puede  ser  aproximado  por  una  distribucion  normal,  es  decir,  si 
riipi,  nxqu  n2p2  y  n2q2  son  todas  mayores  a  5. 


La  propuesta  de  un  bono  para  la  construction  de  una  escuela  sera  enviada  a  los  votantes 
en  la  siguiente  election  municipal.  Una  parte  importante  del  dinero  derivado  de  esta 
emision  de  bonos  se  empleara  en  construir  escuelas  en  una  zona  de  rapido  desarrollo  de 
la  ciudad  y  lo  demas  se  usara  para  renovar  y  actualizar  los  edificios  escolares  del  resto 
de  esta.  Para  evaluar  la  viabilidad  de  la  propuesta  de  un  bono,  a  una  muestra  aleato- 
ria  de  nx  =  50  residentes  de  la  zona  de  rapido  desarrollo  y  n2  =  100  de  las  otras  partes 
de  la  ciudad,  se  les  pregunto  si  piensan  votar  por  la  propuesta.  Los  resultados  se  tabulan  en 
la  tabla  8.6. 


Valores  muestrales  para  opinion  sobre  propuesta  de  bono 

Seccion  en  desarrollo  Resto  de  la  ciudad 


Tamano  muestral 

50 

100 

Numero  a  favor  de  propuesta 

38 

65 

Proporcion  a  favor  de  propuesta 

.76 

.65 

1 .  Estime  la  diferencia  en  las  proporciones  verdaderas  a  favor  de  la  propuesta  de 
bono  con  un  99%  de  intervalo  de  confianza. 

2.  Si  ambas  muestras  se  agrupan  en  una  muestra  de  tamano  n  =  150,  con  103  a 
favor  de  la  propuesta,  de  una  estimacion  puntual  de  la  proporcion  de  residentes 
de  la  ciudad  que  votaran  para  la  propuesta  del  bono.  ^Cual  es  el  margen  de  error? 

Solucion 

1.  La  mejor  estimacion  puntual  de  la  diferencia  (pt  —  p2)  esta  dada  por 

(px  —  p2)  =  .76  —  .65  =  .  1 1 

y  el  error  estandar  de  ( /),  —  p2)  se  estima  como 

|M  +  M_=  /(-76)(.24)  (.65X.35)  = 

\  n'  n2  V  50  100 

Para  un  intervalo  de  confianza  de  99%,  Ztm  =  2.58  y  el  intervalo  aproximado  de 
confianza  de  99%  se  encuentra  como 
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(Pi 


Pi)  —  £.005, 


(Mi  +  M 

n,  n2 


.11  ±  (2.58)(.0770) 
.11  ±  .199, 


o  sea,  (  —  .089,  .309).  Como  este  intervalo  contiene  el  valor  (p\  —  p2)  =  0,  es 
posible  que  px  =  p2,  lo  cual  implica  que  puede  no  haber  diferencia  en  las  propor- 
ciones  a  favor  del  asunto  del  bono  en  las  dos  secciones  de  la  ciudad. 


2.  Si  no  hay  diferencia  en  las  dos  proporciones,  entonces  las  dos  muestras  no 
son  realmente  diferentes  y  podrfan  bien  combinarse  para  obtener  una  estimacion 
total  de  la  proporcion  de  los  residentes  de  la  ciudad  que  votaran  por  el  asunto  del 
bono.  Si  ambas  muestras  se  agrupan,  entonces  n  =  150  y 


P  = 


103 

150 


=  .69 


Por  tanto,  la  estimacion  puntual  del  valor  total  de  p  es  .69,  con  un  margen  de 
error  dado  por 


±1.96j('6^5(031)  =  ±1.96(.0378)  =  ±.074 

Observe  que  .69  ±  .074  produce  el  intervalo  .62  a  .76,  que  incluye  solo  propor¬ 
ciones  mayores  a  .5.  Por  tanto,  si  las  actitudes  de  votantes  no  cambian  de 
manera  adversa  antes  de  la  eleccion,  la  propuesta  del  bono  debe  aprobarse  por 
una  mayorfa  razonable. 


EJERCICIQS 


TECNICAS  BASICAS 

8.50  Muestras  aleatorias  independientes  de  n,  =  500 
y  n2  =  500  observaciones  se  seleccionaron  de  entre  las 
poblaciones  binomiales  1  y  2,  y  se  observaron  x,  =  120  y 
x2  =  147  exitos. 

a.  /Cual  es  el  mejor  estimador  puntual  para  la  diferencia 
(p i  —  p-J  en  las  dos  proporciones  binomiales? 

b.  Calcule  el  error  estandar  aproximado  para  la 
estadfstica  empleada  en  el  inciso  a). 

c.  /Cual  es  el  margen  de  error  para  esta  estimacion  puntual? 

8.51  Muestras  aleatorias  independientes  de  Hi  =  800 
y  n2  =  640  observaciones  se  seleccionaron  de  las 
poblaciones  binomiales  1  y  2,  y  se  observaron  xx  =  337 
y  x2  =  374  exitos. 

a.  Encuentre  un  intervalo  de  confianza  de  90%  para 
la  diferencia  (pt  —  p2)  de  las  dos  proporciones 
poblacionales.  Interprete  el  intervalo. 

b.  /Que  suposiciones  deben  hacerse  para  que  el 
intervalo  de  confianza  sea  valido?  /Se  satisfacen  estas 
suposiciones? 


8.52  Muestras  aleatorias  independientes  de  nx  =  1265 
y  n2  =  1688  observaciones  se  seleccionaron  de  las 
poblaciones  binomiales  1  y  2,  y  se  observaron  jq  =  849  y 
x2  =  910  exitos. 

a.  Encuentre  un  intervalo  de  confianza  de  99%  para 
la  diferencia  (px  —  p2)  de  las  dos  proporciones 
poblacionales.  /Que  significa  “99%  de  confianza”? 

b.  Con  base  en  el  intervalo  de  confianza  del  inciso  a), 

/se  puede  concluir  que  hay  una  diferencia  en  las  dos 
proporciones  binomiales?  Explique. 

APLICACIONES 

8.53  VI  &  M'S  /La  compafha  Mars  Incorporate,  usa 
la  misma  proporcion  de  dulces  rojos  en  sus  variedades 
sencilla  y  de  cacahuate?  Una  muestra  aleatoria  de  56 
M&M’S  sencillos  contenfa  12  dulces  rojos  y  otra  muestra 
aleatoria  de  32  M&M’S  de  cacahuate  contenfa  ocho 
dulces  rojos. 

a.  Construya  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  las  proporciones  de  dulces  rojos  para 
las  variedades  sencilla  y  de  cacahuate. 


www.FreeLibros.me 


8.7  ESTIMACION  DE  LA  DIFERENCIA  ENTFE  DOS  PROPORCIONES  BINOMIALES  O  327 


b.  Con  base  en  el  intervalo  de  confianza  del  inciso  a), 

(\se  puede  concluir  que  hay  una  diferencia  en  las 
proporciones  de  dulces  rojos  para  las  variedades 
sencilla  y  de  cacahuate?  Explique. 

8.54  Realidades  diferentes  Los  votantes  en  las 
elecciones  de  medio  periodo  de  2006  mostraron  que  las 
diferencias  entre  democratas  y  republicanos  se  extienden 
mas  alia  de  asuntos  de  opinion  y  en  realidad  incluyen  la 
forma  en  que  ven  el  mundo.12  Los  tres  problemas  mas 
importantes  mencionados  por  democratas  y  republicanos 
se  detallan  a  continuation. 


1°  2°  3° 


Republicanos  Terrorismo  Economia 

1/7  =  995)  42%  41% 

Democratas  Guerra  de  Irak  Economia 

1/7  =  1094)  60%  44% 


Guerra  de  Irak 
37% 

Atencion  a  la  salud 
44% 


Utilice  un  procedimiento  de  estimacion  de  muestra 
grande  para  comparar  las  proporciones  de  republicanos 
y  democratas  que  mencionaron  la  economia  como 
un  asunto  importante  en  las  elecciones.  Explique  sus 
conclusiones. 

8.55  Aficionados  al  beisbol  El  primer  dia  del  beisbol 
es  a  fines  de  marzo  y  termina  en  octubre  con  la  Serie 
Mundial.  ^ E 1  apoyo  de  los  aficionados  aumenta  a  medida 
que  avanza  la  temporada?  Dos  encuestas  de  la  CNN/ 

USA  7W«v/Galliip,  una  de  ellas  realizada  en  marzo  y 

la  otra  en  noviembre,  contenian  muestras  aleatorias  de 
1001  adultos  de  18  anos  de  edad  o  mas.  En  la  muestra 
de  marzo,  45%  de  los  adultos  dijeron  ser  aficionados  del 
beisbol  profesional,  en  tanto  que  5 1  de  los  adultos  de  la 
muestra  de  noviembre  dijo  que  eran  aficionados.13 

a.  Construya  un  intervalo  de  confianza  de  99%  para  la 
diferencia  en  la  proportion  de  adultos  que  dicen  ser 
aficionados  en  marzo  contra  noviembre. 

b.  7L0S  datos  indican  que  la  proporcion  de  adultos  que 
dicen  ser  aficionados  aumenta  en  noviembre,  mas  o 
menos  en  el  tiempo  de  la  Serie  Mundial?  Explique. 

8.56  Beisbol  y  esteroides  Consulte  el  ejercicio  8.55. 
En  la  encuesta  de  opiniones  de  marzo,  suponga  que  45 1 
adultos  se  identificaron  como  aficionados  al  beisbol,  en 
tanto  que  otros  550  no  eran  aficionados.  Se  planted  la 
siguiente  pregunta: 

2 Los  jugadores  de  beisbol  de  ligas  mctyores  deben  o  no 
ser  examinados  para  ver  si  consumen  esteroides 
u  otras  drogas  que  mejoran  el  rendimiento? 

Suponga  que  410  de  los  aficionados  al  beisbol  y  505 
de  quienes  no  son  aficionados  contestaron  en  forma 
afirmativa  a  esta  pregunta. 

a.  Construya  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  la  proporcion  de  adultos  (aficionados 


contra  no  aficionados)  que  estan  a  favor  de  una  prueba 
obligatoria  de  deteccion  de  drogas  para  jugadores 
profesionales  de  beisbol. 
b.  (;Los  datos  indican  que  hay  una  diferencia  en  la 

proporcion  de  aficionados  contra  no  aficionados  que  estan 
a  favor  de  una  prueba  obligatoria  de  deteccion  de  drogas 
para  jugadores  profesionales  de  beisbol?  Explique. 

8.57  Pescar  un  resfrio  ^Las  personas  cultas  tienen 
menos  resfriados?  Un  estudio  del  Chronicle  of  Higher 
Education  fue  realizado  por  cientfficos  de  la  Carnegie 
Mellon  University,  la  Universidad  de  Pittsburgh  y  la 
Universidad  de  Virginia.  Encontraron  que  las  personas 
que  tienen  solo  unas  pocas  reuniones  sociales  tienen 
menos  resfriados  que  quienes  participan  en  varias 
actividades  sociales.14  Suponga  que  de  los  276  hombres 
y  mujeres  sanos  examinados,  n,  =  96  tenfan  solo  pocas 
reuniones  sociales  y  n2  =  105  estaban  ocupados  con  seis 
o  mas  actividades.  Cuando  estas  personas  se  exponfan  al 
virus  del  resfriado,  se  observaron  los  siguientes  resultados: 

Pocas  reuniones  Muchas  reuniones 
sociales  sociales 

Tamano  muestral  96  105 

Porcentaje  con  resfriado  62%  35% 

a.  Construya  un  intervalo  de  confianza  de  99%  para  la 
diferencia  en  las  dos  proporciones  poblacionales. 

b.  (;Parece  haber  una  diferencia  en  las  proporciones 
poblacionales  para  los  dos  grupos? 

c.  Podrfa  pensarse  que  entrando  en  contacto  con  mas 
personas  llevarfa  a  mas  resfriados,  pero  los  datos 
muestran  el  efecto  opuesto.  ^Como  se  puede  explicar 
este  hallazgo  inesperado? 

8.58  Sindicato,  Si!  Un  muestreo  de  candidates 
politicos,  200  escogidos  del  Oeste  y  200  del  Este,  se 
clasifico  de  acuerdo  a  si  el  candidate  recibio  apoyo  de  un 
sindicato  nacional  del  trabajo  y  si  el  candidato  gano.  En  el 
Oeste,  120  ganadores  tuvieron  apoyo  sindical  y,  en  el  Este, 
142  ganadores  tuvieron  el  apoyo  de  un  sindicato  nacional. 
Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  entre  las  proporciones  de  ganadores  con  apoyo 
sindical  en  el  Oeste  contra  el  Este.  Interprete  este  intervalo. 

8.59  Orden  de  nacimiento  y  exito  universitario  En 

un  estudio  de  la  relacion  entre  el  orden  de  nacimiento  y 
exito  universitario,  un  investigador  encontro  que  126  de 
entre  una  muestra  de  1 80  graduados  universitarios  eran 
primogenitos  o  hijos  unicos.  En  una  muestra  de  100  no 
graduados  de  edad  y  nivel  socioeconomico  comparables, 
el  ruimero  de  primogenitos  o  hijos  unicos  fue  54.  Estime 
la  diferencia  entre  las  proporciones  de  primogenitos 
o  hijos  unicos  en  las  dos  poblaciones  de  las  cuales  se 
tomaron  estas  muestras.  Use  un  intervalo  de  confianza 
de  90%  e  interprete  sus  resultados. 
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8.60  Siguiente  generation  Nacidos  entre  1980  y 
1990,  la  Generation  Siguiente  ha  vivido  en  un  mundo 
posterior  a  la  Guerra  Frfa  y  un  tiempo  de  relativa 
prosperidad  economica  en  Estados  Unidos,  pero  tambien 
han  conocido  el  1 1  de  septiembre  y  el  temor  a  otro  ataque, 
dos  Guerras  del  Golfo,  la  tragedia  de  la  Secundaria  de 
Columbine,  el  huracan  Katrina  y  la  creciente  polarization 
de  discursos  publicos.  Mas  que  cualquiera  que  llego 
antes,  la  Generation  Siguiente  esta  comprometida  con  la 
tecnologfa  y  la  gran  mayorra  depende  de  ella.15  Suponga 
que  de  una  encuesta  de  500  estudiantes  mujeres  y  500 
hombres  de  la  Generation  Siguiente,  345  de  las  mujeres 

y  365  de  los  hombres  dijeron  que  decidieron  asistir  a  la 
universidad  para  ganar  mas  dinero. 

a.  Construya  un  intervalo  de  confianza  de  98%  para  la 
diferencia  en  las  proporciones  de  estudiantes  mujeres 
y  hombres  que  decidieron  asistir  a  la  universidad  para 
ganar  mas  dinero. 

b.  ^Que  significa  decir  que  esta  “98%  seguro”? 

c.  Con  base  en  el  intervalo  de  confianza  del  inciso  a), 

^se  puede  concluir  que  hay  una  diferencia  en  las 
proporciones  de  estudiantes  mujeres  y  hombres  que 
decidieron  asistir  a  la  universidad  para  ganar  mas 
dinero? 

8.61  iExcedrina  o  Tylenol?  En  un  estudio  para 
comparar  los  efectos  de  dos  analgesicos  se  encontro 
que,  de  n,  =  200  personas  seleccionadas  al  azar  y  a 
las  que  se  dieron  instrucciones  de  usar  el  primer 


analgesico,  93%  indicaron  que  alivio  su  dolor.  De  n2  = 
450  personas  seleccionadas  al  azar  para  usar  el  segundo 
analgesico,  96%  indicaron  que  les  alivio  el  dolor. 

a.  Encuentre  un  intervalo  de  confianza  de  99%  para  la 
diferencia  en  las  proporciones  que  experimentan  alivio 
por  estos  dos  analgesicos. 

b.  Con  base  en  el  intervalo  de  confianza  del  inciso  a), 
(4iay  suficiente  evidencia  para  indicar  una  diferencia 
en  las  proporciones  que  experimentan  alivio  para  los 
dos  analgesicos?  Explique. 

8.62  Accidentes  automovih'sticos  Los  registros 
del  ano  pasado  sobre  accidentes  automovibsticos,  en 
una  section  determinada  de  carreteras,  se  clasificaron 
de  acuerdo  a  si  las  perdidas  resultantes  eran  de  $1000  o 
mas  y  si  una  lesion  frsica  resulto  del  accidente.  Los  datos 
siguen: 

Menos  de  $1000  $1000  o  mas 

Numero  de  accidentes  32  41 

Numero  donde  hubo  lesionados  10  23 

a.  Estime  la  verdadera  proportion  de  accidentes  donde 
hubo  lesionados  cuando  el  dano  fue  de  $1000  o  mas, 
para  secciones  similares  de  carretera,  y  encuentre  el 
margen  de  error. 

b.  Estime  la  verdadera  diferencia  en  la  proportion  de 
accidentes  donde  hubo  lesionados  en  accidentes  con 
perdidas  menores  a  $1000  y  aquellos  con  perdidas  de 
$1000  o  mas.  Use  un  intervalo  de  confianza  de  95%. 


LIMITES  DE  CONFIANZA  A  UNA  COLA 


Los  intervalos  de  confianza  estudiados  en  las  secciones  8. 5-8. 7  a  veces  reciben  el  nom- 
bre  de  intervalos  de  confianza  a  dos  colas,  porque  producen  lrmites  superiores  (UCL) 
e  inferiores  (LCL)  para  el  parametro  de  interes,  pero  a  veces  un  experimentador  esta 
interesado  en  solo  uno  de  estos  lrmites;  esto  es,  necesita  solo  un  limite  superior  (o  posi- 
blemente  un  lrmite  inferior)  para  el  parametro  de  interes.  En  este  caso,  se  puede  cons- 
truir  un  limite  de  confianza  de  una  cola  para  el  parametro  de  interes,  por  ejemplo  p. 


P ,  Pi  ~  Pi  o  pi  -  p2. 

Cuando  la  distribution  muestral  de  un  estimador  puntual  es  aproximadamente  nor¬ 
mal,  se  puede  usar  un  argumento  similar  al  de  la  section  8.5  para  mostrar  que  los  lrmi¬ 
tes  de  confianza  de  una  cola,  construidos  usando  las  siguientes  ecuaciones  cuando  el 
tamano  muestral  es  grande ,  contendran  el  verdadero  valor  del  parametro  de  interes 
(1  —  a)  100%  del  tiempo  en  muestreo  repetido. 


UN  LIMITE  INFERIOR  DE  CONFIANZA  (1  -  a)100%  (LCB) 

(Estimador  puntual)  —  za  x  (Error  estandar  del  estimador) 

UN  LIMITE  SUPERIOR  DE  CONFIANZA  (1  -  a)100%  (UCB) 

(Estimador  puntual)  +  za  x  (Error  estandar  del  estimador) 
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El  valor  z  para  un  limite  de  confianza  de  una  cola  (1  —  a)  100%,  za,  localiza  un  area  a  en 
una  sola  cola  de  la  distribucion  normal,  como  se  muestra  en  la  figura  8.13. 


FIGURA  8.1  3 

Valor  zpara  un  llmite 
de  confianza  de  una  cola 


Una  corporacion  planea  emitir  algunos  documentos  a  corto  plazo  y  espera  que  el  interes 
que  tendra  para  pagar  no  rebasara  el  1 1.5%.  Para  obtener  alguna  informacion  acerca  de 
este  problema,  la  corporacion  vendio  40  documentos,  uno  a  traves  de  cada  una  de  las  40 
empresas  de  corretaje  de  acciones.  La  media  y  desviacion  estandar  para  las  40  tasas  de 
interes  fueron  10.3%  y  .31%,  respectivamente.  Como  la  corporacion  esta  interesada  en 
solo  un  limite  superior  en  las  tasas  de  interes,  encuentre  un  limite  superior  de  confianza 
de  95%  para  la  tasa  media  de  interes  que  la  corporacion  tendra  que  pagar  por  los  docu¬ 
mentos. 


Solucion  Como  el  parametro  de  interes  es  jx.  el  estimador  puntual  es  x  con  error 

estandar  SE  ~  — El  coeficiente  de  confianza  es  .95,  de  modo  que  a  =  .05  y 
Vn 

Z.05  =  1.645.  Por  lo  tanto,  el  limite  superior  de  confianza  de  95%  es 

UCB  =  x+  1.645^= j  =  10.3  +  1.645^==j  =  10.3  +  .0806  =  10.3806 

Entonces,  se  puede  estimar  que  la  tasa  media  de  interes  que  la  corporacion  tendra  que 
pagar  sobre  sus  documentos  sera  menos  al  10.3806%.  La  corporacion  no  debe  preocu- 
parse  por  sus  tasas  de  interes  que  rebasen  del  1 1.5%.  <:,Que  tan  seguro  esta  usted  de  esta 
conclusion?  Bastante  seguro,  porque  los  intervalos  construidos  en  esta  forma  contienen 
a  fi,  el  95%  del  tiempo. 


SELECCION  DEL  TAMANO  MUESTRAL 


Disenar  un  experimento  es  en  esencia  un  plan  para  comprar  cierta  cantidad  de  informa¬ 
cion.  Asi  como  el  precio  que  se  paga  por  un  juego  de  video  varfa  dependiendo  de  donde 
y  cuando  se  compra,  el  precio  de  informacion  estadistica  varia  dependiendo  de  como  y 
donde  se  recolecta  la  informacion.  Al  igual  que  cuando  se  compra  cualquier  producto, 
se  debe  comprar  tanta  informacion  estadistica  como  sea  posible  por  el  minimo  costo 
posible. 

La  cantidad  total  de  informacion  relevante  en  una  muestra  es  controlada  por  dos 
fac tores: 


•  El  plan  muestral  o  diseno  experimental:  el  procedimiento  para  recolectar  la 
informacion 

•  El  tamano  muestral  n :  la  cantidad  de  informacion  recolectada 
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Se  puede  aumentar  la  cantidad  de  informacion  recolectada  al  aumentar  el  tamano  mues- 
tral  o  quiza  al  cambiar  el  tipo  de  plan  muestral  o  diseno  experimental  que  se  utilice. 
Trataremos  el  plan  muestral  mas  sencillo,  es  decir,  el  muestreo  aleatorio  de  una  pobla- 
cion  relativamente  grande  y  nos  concentraremos  en  las  formas  para  escoger  el  tamano 
muestral  n  necesario  para  comprar  una  cantidad  determinada  de  informacion. 

Un  investigador  hace  poco  progreso  al  planear  un  experimento  antes  de  encontrar  el 
problema  del  tamano  muestral.  ;,Cuantas  mediciones  deben  incluirse  en  la  muestra? 
(  Cuanta  informacion  desea  comprar  el  investigador?  La  cantidad  total  de  informacion 
de  la  muestra  afectara  la  confiabilidad  o  bondad  de  las  inferencias  hechas  por  el  inves¬ 
tigador  y  es  esta  confiabilidad  la  que  debe  el  especificar.  En  un  problema  de  estimacion 
estadfstica,  la  precision  de  la  estimacion  es  medida  por  el  margen  de  error  o  el  ancho  del 
intervalo  de  confianza.  Como  estas  dos  mediciones  son  una  funcion  del  tamano  mues¬ 
tral,  especificar  la  precision  determina  el  tamano  muestral  necesario. 

Por  ejemplo,  suponga  que  se  desea  estimar  el  promedio  de  produccion  diaria  fx  de 
un  proceso  qufmico  y  se  necesita  que  el  margen  de  error  sea  menor  a  4  toneladas.  Esto 
significa  que,  aproximadamente  95%  del  tiempo  en  muestreo  repetido,  la  distancia  entre 
la  media  muestral  x  y  la  media  poblacional  fx  sera  menor  a  1.96  SE.  Se  desea  que  esta 
cantidad  sea  menor  a  4.  Esto  es, 


1.96  SE<  4  o  1 .96^=j  <  4 
Despejando  n,  resulta 
'  1.96?2 


n  > 


er2  o  n  >  .24er2 


Si  se  conoce  er,  la  desviacion  estandar  poblacional,  se  puede  sustituir  su  valor  en  la 
formula  y  despejar  n.  Si  cres  desconocida,  que  suele  ser  el  caso,  se  puede  usar  la  mejor 
aproximacion  disponible: 

•  Una  estimacion  5  se  obtiene  de  una  muestra  previa 

•  Una  estimacion  del  rango  basada  en  el  conocimiento  de  las  mediciones  maximas 
y  mmimas  posibles:  er  ~  Rango/4 


Para  este  ejemplo,  suponga  que  un  estudio  previo  del  proceso  qufmico  produjo  una  des¬ 
viacion  muestral  estandar  de  5  =  21  toneladas.  Entonces 

n  >  .24cr2  =  ,24(21)2  =  105.8 

Usando  una  muestra  de  tamano  n  =  106  o  mayor,  se  puede  estar  razonablemente  seguro 
(con  probabilidad  aproximadamente  igual  a  .95)  que  su  estimacion  del  promedio  de  pro¬ 
duccion  estara  a  no  mas  de  ±  4  toneladas  del  promedio  real  de  produccion. 

La  solucion  n  =  106  es  solo  aproximada  porque  tenia  que  usarse  un  valor  aproximado 
de  cr  para  calcular  el  error  estandar  de  la  media.  Aun  cuando  esto  puede  ser  molesto,  es 
el  mejor  metodo  existente  para  seleccionar  el  tamano  muestral  y  es  ciertamente  mejor 
que  adivinar. 

A  veces  los  investigadores  requieren  un  nivel  de  confianza  diferente  al  95%  de  con¬ 
fianza  especificado  por  el  margen  de  error.  En  este  caso,  la  mitad  del  ancho  del  intervalo 
de  confianza  da  la  medida  precisa  para  su  estimacion;  esto  es,  el  lfmite  B  en  el  error  de 
su  estimacion  es 


<B 
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E  J  E  M  P  L 


Este  metodo  de  seleccionar  el  tamano  muestral  se  puede  usar  para  los  cuatro  procedi- 
mientos  de  estimacion  presentados  en  este  capttulo.  El  procedimiento  general  se  des¬ 
cribe  a  continuation. 


m 


ENTRENADOR  PERSONAL 

iComo  selecciono  el  tamano  muestral? 


Determine  el  parametro  y  el  error  estandar  a  estimarse  de  su  estimador  puntual. 
A  continuation  proceda  como  sigue: 


1.  Escoja  B,  el  lfmite  en  el  error  de  su  estimacion  y  un  coeficiente  de  confianza 
(1  -  a). 

2.  Para  un  problema  de  una  muestra,  de  esta  ecuacion  despeje  el  tamano  muestral  n: 

Za/2  x  (error  estandar  del  estimador)  <  B 
donde  Zan  es  el  valor  de  z  que  tiene  un  area  a  12  a  su  derecha. 

3.  Para  un  problema  de  dos  muestras,  haga  nl  =  n2  =  n  y  resuelva  la  ecuacion  del 
paso  2. 


[nota:  Para  casi  todos  los  estimadores  (todos  presentados  en  este  texto),  el  error 
estandar  es  una  funcion  del  tamano  muestral  «.] 


Repertorio  de  ejercicios 

Llene  los  espacios  en  bianco  de  la  tabla  siguiente  y  encuentre  los  tamanos  muestrales 
necesarios.  El  primer  problema  ya  ha  sido  resuelto. 


Tipo  de 
datos 

Una  o 
dos 

muestras 

Margen  de  error 

po  O’ 

Lfmite 

B 

Resuelva  esta 
desigualdad 

Tamano  muestral 

Binomio 

1 

P~-  4 

.1 

•  -i 

n  ' 

(T  ~  6 

1 

-  i 

n  > 

Cuantitativo 

2 

(7,  =  02  =  6 

2 

-  2 

=3 

II 

r? 

IV 

Pi  =  Pi  *=  .4 

.05 

-  .05 

n,  =  n-,  > 

Informe  de  progreso 

•  (',Todav fa  tiene  problemas?  Trate  de  nuevo  usando  el  Repertorio  de  ejercicios 
del  final  de  esta  section. 

•  (.Ya  domina  la  tabla  z?  Puede  saltarse  el  Repertorio  de  ejercicios  del  final  de 
esta  section. 


Las  respuestas  estan  al  final  de  este  libro. 


Los  productores  de  tubo  de  plastico  de  polivinilo  desean  tener  un  suministro  de  tubos 
suficiente  para  satisfacer  las  necesidades  del  mercado.  Desean  encuestar  mayoristas  que 
compren  tubos  de  polivinilo  para  estimar  la  proportion  que  planea  aumentar  sus  com- 
pras  el  ano  proximo.  <(Que  tamano  muestral  se  requiere  si  desean  que  su  estimacion  se 
encuentre  a  no  mas  de  .04  de  la  proportion  real  con  probabilidad  igual  a  .90? 
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Solucion  Para  este  ejemplo  particular,  el  llmite  B  en  el  error  de  la  estimacion  es  .04. 
Como  el  coeficiente  de  confianza  es  (1  —  a)=  .90,  a  debe  ser  igual  a  .10  y  a/2  es  .05. 
El  valor  z  correspondiente  a  un  area  igual  a  .05  en  la  cola  superior  de  la  distribution  z  es 
Z.05  =  1.645.  Entonces  se  requiere 


Para  despejar  n  de  esta  ecuacion,  se  debe  sustituir  un  valor  aproximado  de  p  en  la  ecua¬ 
cion.  Si  se  desea  estar  seguro  que  la  muestra  es  suficientemente  grande,  debe  usarse 
p  =  .5  (sustituir =  .5  dara  la  maxima  solucion  posible  para  n  porque  el  maximo  valor 
de  pq  se  presenta  cuandop  =  q  =  .5).  Entonces 


o  bien 


n  >  (20.56)2  =  422.7 

Por  tanto,  los  productores  deben  incluir  al  menos  423  mayoristas  en  su  encuesta  si  desean 
estimar  la  proportion  p  correcta  a  no  mas  de  .04. 


Un  director  de  personal  desea  comparar  la  efectividad  de  dos  metodos  de  capacitar 
empleados  industriales  a  realizar  cierta  operacion  de  ensamble.  Un  numero  de  emplea- 
dos  se  ha  de  dividir  en  dos  grupos  iguales:  el  primero  recibiendo  capacitacion  del 
metodo  1  y,  el  segundo,  el  metodo  de  capacitacion  2.  Cada  uno  efectuara  la  operacion 
de  ensamble  y  el  tiempo  de  ensamblado  se  registrara.  Se  espera  que  las  mediciones  para 
ambos  grupos  tendran  una  variation  de  alrededor  de  8  minutos.  Para  que  la  estimacion 
de  la  diferencia  en  tiempos  medios  de  ensamble  sea  correcta  a  no  mas  de  1  minuto  de 
variation,  con  una  probabilidad  igual  a  .95,  ^cuantos  trabajadores  deben  estar  incluidos 
en  cada  grupo  de  capacitacion? 

Haciendo  B  =  1  minuto,  tenemos 


Como  se  desea  que  nx  sea  igual  a  n2,  se  puede  hacer  n i  =  n2  =  n  y  obtener  la  ecuacion 


Como  ya  observamos,  la  variabilidad  (intervalo)  de  cada  metodo  de  ensamble  es  aproxi- 
madamente  igual  y,  por  lo  tanto,  a\  =  <j\  =  a2.  Como  el  intervalo,  igual  a  8  minutos, 
es  aproximadamente  igual  a  4cr,  tenemos 

4er  ~  8  o  sea  a~  2 
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Sustituyendo  este  valor  por  o',  y  cr2  en  la  ecuacion  anterior,  se  obtiene 
1.96 


(2 y  or  < , 

I  n  ^  n  ~ 


1-96  <  1 


n  >  1.96V8 

Resolviendo,  tenemos  n  >  31.  Por  tanto,  cada  grupo  debe  contener  al  menos  n  =  31 
trabaj  adores. 


La  tabla  8.7  contiene  un  resumen  de  las  formulas  empleadas  para  determinar  los 
tamanos  muestrales  requeridos  para  estimation,  con  un  limite  dado  en  el  error  de  la  esti¬ 
mation  o  ancho  de  intervalo  de  confianza  W  (  W  =  2 B).  Observe  que  para  estimar  p,  la 
formula  del  tamano  muestral  usa  cr2  =  pq,  en  tanto  que  para  estimar  (/;  —  p2),  la  formu¬ 
la  del  tamano  muestral  usa  er2  =  pxqx  y  a\  =  p2q2. 


TABLA  8.7 


Formulas  para  tamano  muestral 


© 


EJERCICIOS 


Parametro 

Estimador 

Tamano  muestral 

Suposiciones 

M 

X 

,2  _2 

n>  al2 

B2 

Ml  “  M2 

x,  -  x2 

„  _  z2q/2(o-^  +  a\) 

B 2 

( n>zinPP 

B2 

/7-]  —  a?2  —  n 

P 

P 

0 

(-25)^2 
l  B2 

p=.5 

'  4/2  (ft  ft  +  ftft) 

B2 

ri]  —  /?2  =  n 

Pi  —  Pi 

Pi  —  ft 

0 

2(.25)z2/2 
[  B 2 

n}  =  n2  =  n  y 

Pi  =  Pi  =  -5 

REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  ref i ere n  a  la  seccion  Mi  entrenador  personal  de  la  pagina  331. 

8.63  Llene  los  espacios  en  bianco  de  la  tabla  siguiente  y  encuentre  los  tamanos  muestrales 
necesarios. 


Tipo  de 
datos 

Una  o 
dos 

muestras 

Margen  de  error 

poo- 

Limite 

6 

Resuelva  esta 
desigualdad 

Tamano  muestral 

Binomio 

1 

P--5 

.05 

-  .05 

n  > 

1.96  2= 

Vn 

<7=  10 

2 

■  7 

n  > 
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8.64  Llene  los  espacios  en  bianco  de  la  tabla  siguiente  y  encuentre  los  tamanos 
muestrales  necesarios. 


Tipo  de 
datos 

Una  o 
dos 

muestras 

Margen  de  error 

poo- 

Limite 

B 

Resuelva  esta 
desigualdad 

Tamano  muestral 

Cuantitativo 

2 

a,  ~  cr2  «  10 

4 

<4 

n,  =  n2> 

1.96  j  Ml  +  Ml 

Pi  =  Pi  “  -5 

.10 

-  .10 

n,  =  n,  =- 

V  fh  rl2 

TECNICAS  BASICAS 

8.65  Encuentre  un  I  (mite  superior  de  confianza  de 
una  cola  al  90%  para  la  media  poblacional  /x  para  estos 
valores: 

a.  n  =  40,  s2  =  65,  x  =  75 

b.  n  =  100,  s  =  2.3,  x  =  1.6 

8.66  Encuentre  un  limite  inferior  de  confianza  al  99% 
para  la  proporcion  binomial  p  cuando  una  muestra 
aleatoria  de  n  =  400  intentos  produjo  x  =  196  exitos. 

8.67  Muestras  aleatorias  independientes  de  tamano 
50  son  sacadas  de  dos  poblaciones  cuantitativas, 
produciendo  la  informacion  muestral  de  la  tabla. 
Encuentre  un  limite  superior  de  confianza  de  95%  para 
la  diferencia  en  las  dos  medias  poblacionales. 


Muestra  1 

Muestra  2 

Tamano  muestral 

50 

50 

Media  muestral 

12 

10 

Desviacion  estandar  muestral 

5 

7 

8.68  Supongamos  que  usted  desea  estimar  una  media 
poblacional  basada  en  una  muestra  aleatoria  de  n 
observaciones  y  experiencias  anteriores  sugieren  que 
cr  =  12.7.  Si  desea  estimar  /x  correcta  a  no  mas  de  1.6 
de  variacion,  con  probabilidad  igual  a  .95,  ^cuantas 
observaciones  deben  estar  incluidas  en  su  muestra? 

8.69  Supongamos  que  usted  desea  estimar  un  parametro 
binomial  p  correcto  a  no  mas  de  .04  de  variacion,  con 
probabilidad  igual  a  .95.  Si  sospecha  que  p  es  igual  a 
algun  valor  entre  .1  y  .3  y  desea  estar  seguro  que  su 
muestra  es  suficientemente  grande,  £que  tan  grande  debe 
ser  nl  (sugerencia:  Cuando  calcule  el  error  estandar, 
use  el  valor  de  p  en  el  intervalo  .  1  <  p  <  .3  que  dara  el 
tamano  muestral  mas  grande.) 

8.70  Muestras  aleatorias  independientes  de  n,  =  n2  =  n 
observaciones  han  de  seleccionarse  de  cada  una  de  las 
poblaciones  1  y  2.  Si  se  desea  estimar  la  diferencia  entre 
las  dos  medias  poblacionales  correctas  a  no  mas  de  .  1 7  de 
variacion,  con  probabilidad  igual  a  .90,  (',que  tan  grande 


deben  ser  nx  y  n{\  Suponga  que  se  conocen  a\~  <j\~ 
27.8. 

8.71  Muestras  aleatorias  independientes  de  ri\  =  n2  =  n 
observaciones  han  de  seleccionarse  de  cada  una  de  las 
poblaciones  1  y  2.  Si  se  desea  estimar  la  diferencia  entre 
las  dos  medias  poblacionales  correctas  a  no  mas  de  .05  de 
variacion,  con  probabilidad  igual  a  .98,  /.que  tan  grande 
deben  ser  n?  Suponga  que  no  hay  informacion  anterior 
en  los  valores  de  p,  y  p2,  pero  que  usted  desea  asegurarse 
de  tener  un  numero  adecuado  de  observaciones  en  las 
muestras. 

APLICACIONES 

8.72  Gastos  de  operacion  Una  muestra  aleatoria  de 
los  costos  mensuales  de  operacion  de  una  compafua  para 
n  =  36  meses  produjo  una  media  muestral  de  $5474  y 
una  desviacion  estandar  de  $764.  Encuentre  un  limite 
superior  de  confianza  para  los  gastos  mensuales  medios 
de  la  compafua. 

8.73  Inmigracion  legal  El  ejercicio  8.17  analizo 
una  encuesta  de  investigacion  realizada  por  Fox  News 
by  Opinion  Dynamics  respecto  a  opiniones  acerca  del 
numero  de  inmigrantes  legales  que  entran  a  Estados 
Unidos.3  Suponga  que  esta  usted  disenando  una  encuesta 
de  este  tipo. 

a.  Explique  como  seleccionaria  su  muestra.  /.Que 
problemas  podria  encontrar  en  este  proceso? 

b.  Si  usted  desea  estimar  el  porcentaje  de  la  poblacion 
que  esta  de  acuerdo  con  una  frase  particular  en  su 
cuestionario  de  encuesta,  correcto  a  no  mas  de  1  %  con 
probabilidad  .95,  /.aprox i madamente  cuantas  personas 
tendrian  que  ser  encuestadas? 

8.74  Corrupcion  politica  Un  cuestionario  esta 
disenado  para  investigar  actitudes  acerca  de  corrupcion 
politica  en  el  gobierno.  Al  experimentador  le  gustaria 
encuestar  a  dos  grupos  diferentes,  republicanos 

y  democratas,  y  comparar  las  respuestas  contra 
varias  preguntas  de  “si/no”  para  los  dos  grupos.  El 
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experimentador  requiere  que  el  error  muestral  para  la 
diferencia  en  la  proportion  de  respuestas  positivas  para 
los  dos  grupos  no  sea  mas  de  ±  3  puntos  porcentuales. 

Si  las  dos  muestras  son  del  mismo  tamano,  ,'.que  tan 
grandes  deben  ser  las  muestras? 

8.75  jMenos  carne  roja!  Muchos  estadounidenses 
estan  ahora  mas  conscientes  de  la  importancia  de  una 
buena  nutricion  y  algunos  investigadores  creen  que 
podemos  estar  alterando  nuestras  dietas  para  incluir 
menos  carne  roja  y  mas  frutas  y  verduras.  Para  probar 
esta  teorfa,  una  investigadora  decide  seleccionar  registros 
de  nutricion  en  hospitales,  para  personas  encuestadas 
hace  10  anos  y  comparar  el  promedio  de  cantidad 

de  carne  consumida  por  ano  contra  las  cantidades 
consumidas  por  un  numero  igual  de  personas  a  quienes 
ella  entrevistara  este  ano.  Ella  sabe  que  la  cantidad  de 
carne  consumida  anualmente  por  los  estadounidenses 
varfa  de  0  a  alrededor  de  104  libras.  ^Cuantas  personas 
debe  seleccionar  la  investigadora  de  cada  grupo  si  ella 
desea  estimar  la  diferencia  en  el  promedio  anual  de 
consumo  de  carne  per  capita,  correcto  a  no  mas  de  5 
libras  con  99%  de  confianza? 

8.76  Carne  roja,  continua  Consulte  el  ejercicio  8.75. 
La  investigadora  selecciona  dos  grupos  de  400  personas 
cada  uno  y  recolecta  la  siguiente  information  muestral  en 
el  consumo  anual  de  carne  de  res  ahora  y  hace  10  anos: 

Hace  10  anos  Este  ano 

Media  muestral  73  63 

Desviacion  muestral  estandar  25  28 

a.  A  la  investigadora  le  gustarfa  demostrar  que  el 
consumo  per  capita  de  carne  ha  disminuido  en  los 
ultimos  10  anos,  de  modo  que  necesita  demostrar 
que  la  diferencia  en  los  promedios  es  mayor  a  0. 
Encuentre  un  limite  inferior  de  confianza  de  99% 
para  la  diferencia  en  el  promedio  de  consumos  per 
capita  de  carne  de  res  para  los  dos  grupos. 

b.  7,Que  conclusiones  puede  sacar  la  investigadora 
usando  el  lfmite  de  confianza  del  inciso  a)? 

8.77  Temporada  de  caceria  Si  una  dependencia  de 
fauna  silvestre  desea  estimar  el  numero  medio  de  dfas  de 
caceria  por  cazador,  para  todos  los  cazadores  con  licencia 
en  el  estado  durante  una  temporada  determinada,  con 

un  limite  en  el  error  de  estimacion  igual  a  dos  dias  de 


caceria,  /  cuantos  cazadores  deben  estar  incluidos  en 
la  encuesta?  Suponga  que  los  datos  recolectados 
en  encuestas  anteriores  han  demostrado  que  cr  es 
aproximadamente  igual  a  10. 

8.78  Lluvia  contaminada  Supongamos  que  usted 
desea  estimar  el  pH  medio  de  lluvia  en  una  zona  que 
sufre  de  fuerte  contaminacion  debida  a  la  descarga  de 
humo  de  una  planta  generadora  de  electricidad.  Se  sabe 
que  cr  esta  en  la  cercania  de  .5  pH  y  que  se  desea 
estimar  que  se  encuentre  dentro  de  .  1  de  /x,  con  una 
probabilidad  cercana  a  .95.  ^  Aproximadamente  cuantas 
precipitaciones  de  lluvia  deben  incluirse  en  su  muestra 
(una  lectura  de  pH  por  lluvia)?  (',Serfa  valido  seleccionar 
todos  sus  especimenes  de  una  sola  lluvia?  Explique. 

8.79  pH  en  lluvia  Consulte  el  ejercicio  8.78.  Suponga 
que  se  desea  estimar  la  diferencia  entre  la  acidez  media 
para  lluvias  en  dos  lugares  diferentes,  uno  en  una  zona 
relativamente  no  contaminada  a  lo  largo  del  oceano  y 

la  otra  en  una  zona  sujeta  a  fuerte  contaminacion  del  aire. 
Si  usted  desea  que  su  estimacion  sea  correcta  al .  1 
de  pH  mas  cercano,  con  probabilidad  cercana  a  .90, 
^aproximadamente  cuantas  lluvias  (valores  de  pH) 
tendrfan  que  incluirse  en  cada  muestra?  (Suponga  que  la 
varianza  de  las  mediciones  de  pH  es  aproximadamente 
.25  en  ambos  lugares  y  que  las  muestras  seran  de  igual 
tamano.) 

8.80  Promedios  de  calificaciones  Se  desea  estimar 
la  diferencia  en  promedios  de  calificaciones  entre  dos 
grupos  de  estudiantes  universitarios,  precisa  a  no  mas 
de  .2  puntos,  con  probabilidad  aproximadamente  igual 
a  .95.  Si  la  desviacion  estandar  de  las  mediciones  de 
calificaciones  es  aproximadamente  igual  a  .6,  (',cuantos 
estudiantes  deben  incluirse  en  cada  grupo?  (Suponga  que 
los  grupos  seran  de  igual  tamano.) 

8.81  Selenio,  otra  vez  Refierase  a  la  comparacion 
de  la  ingesta  diaria  de  selenio,  que  toman  adultos  en 
dos  regiones  diferentes  de  Estados  Unidos,  que  vimos 
en  el  ejercicio  8.41.  Supongamos  que  se  desea  estimar 
la  diferencia  en  las  ingestas  diarias  medias  entre  las 
dos  regiones,  correcta  a  no  mas  de  5  microgramos  de 
variation,  con  probabilidad  igual  a  .90.  Si  se  planea 
seleccionar  un  numero  igual  de  adultos  de  entre  las  dos 
regiones  (es  decir,  n,  =  n2),  <:,que  tan  grandes  deben  ser 
«i  Y  «2? 


www.FreeLibros.me 


336  O  CAPITLILO  8  ESTIMACION  DE  MUESTRAS  GRANDES 


REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Tipos  de  estimadores 

1.  Estimador  puntual:  un  solo  numero  se  calcula 
para  estimar  el  parametro  poblacional. 

2.  Estimador  de  intervalo:  dos  numeros  se  calculan 
para  formar  un  intervalo  que,  con  cierta  cantidad 
de  confianza,  contiene  al  parametro. 

II.  Propiedades  de  buenos  estimadores 

1.  Insesgado:  el  valor  promedio  del  estimador  es 
igual  al  parametro  a  ser  estimado. 

2.  Varianza  minima:  de  todos  los  estimadores  inses- 
gados,  el  mejor  estimador  tiene  una  distribucion 
muestral  con  el  error  estandar  mas  pequeno. 

3.  El  margen  de  error  mide  la  distancia  maxima 
entre  el  estimador  y  el  verdadero  valor  del 
parametro. 

III.  Estimadores  puntuales 
de  muestra  grande 

Para  estimar  uno  de  cuatro  parametros  poblacionales 
cuando  los  tamanos  muestrales  sean  grandes,  use  los 
siguientes  estimadores  puntuales  con  los  margenes 
de  error  apropiados. 

Parametro  Estimador  puntual  95%  de  margen  de  error 

p,  x 

x 

p  p  =  - 


Ml  M2  *1  *2 

Pi  -  Pi  (p, -p2)  = 

\^i  n2) 


±1.96-7= 


±1.96 


±1.96 


±1.96 


P 1P1  P2Q2 

I  n,  n2 


1.  Todos  los  valores  del  intervalo  son  posibles 
valores  para  el  parametro  poblacional 
desconocido. 

2.  Es  improbable  que  algunos  valores  fuera  del 
intervalo  sean  el  valor  del  parametro  desconocido. 

3.  Para  comparar  dos  medias  poblacionales  o 
proporciones,  busque  el  valor  0  en  el  intervalo  de 
confianza.  Si  0  esta  en  el  intervalo,  es  posible  que 
las  dos  medias  poblacionales  o  proporciones  sean 
iguales  y  no  deberfa  declararse  una  diferencia. 

Si  0  no  esta  en  el  intervalo,  es  improbable  que 
las  dos  medias  o  proporciones  sean  iguales  y  se 
puede  declarar  con  seguridad  una  diferencia. 

V.  Limites  de  confianza  de  una  cola 

Utilice  ya  sea  el  lfmite  superior  (+)  o  el  inferior 
(— )  de  dos  colas,  con  el  valor  crftico  de  z 
cambiado  de  Zan  a  za. 

VI.  Seleccion  del  tamano  muestral 

1 .  Determine  el  tamano  del  margen  de  error,  B,  que 
este  usted  dispuesto  a  tolerar. 

2.  Seleccione  el  tamano  muestral  al  despejar  n  o 
n  =  iii  =  n2  en  la  desigualdad:  zan  —  B,  donde 
SE  (error  estandar)  es  una  funcion  del  tamano 
muestral  n. 

3.  Para  poblaciones  cuantitativas,  estime  la 
desviacion  poblacional  estandar  usando  un  valor 
previamente  calculado  de  .v  o  la  aproximacion  de 
rango  cr  ~  Margen/4. 

4.  Para  poblaciones  binomiales,  use  el  metodo 
conservative  y  aproxime  p  usando  el  valor  p  =  .5. 


IV.  Estimadores  de  intervalo 
de  muestra  grande 

Para  estimar  uno  de  cuatro  parametros  poblacionales 
cuando  los  tamanos  muestrales  son  grandes,  use  los 
siguientes  estimadores  de  intervalo. 

Parametro  Intervalo  de  confianza  (1  —  a)100% 

P-  x±z“/2(v^) 

P  P± 

/X,  -  /x2  (x,  - 

Pi  -  ft  (Pi  -  p2)  ± 

V  n2 


EJercicios  suplementarios 

8.82  Exprese  el  teorema  del  lfmite  central.  (jDe  que 
valor  es  el  teorema  del  lfmite  central  en  estimacion 
estadfstica  de  muestra  grande? 

8.83  Una  muestra  aleatoria  de  n  =  64  observaciones 
tiene  una  media  de  x  y  una  desviacion  estandar  s  =  3.9. 

a.  De  la  estimacion  puntual  de  la  media  poblacional  p,  y 
encuentre  el  margen  de  error  para  su  estimacion. 

b.  Encuentre  un  intervalo  de  confianza  de  90%  para  p. 
lQu6  significa  “90%  seguro”? 

c.  Encuentre  un  lfmite  inferior  de  confianza  de  90% 
para  la  media  poblacional  p.  (iPor  que  este  lfmite  es 
diferente  del  lfmite  inferior  de  confianza  del  inciso  b)? 
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d.  ('  Cuantas  observaciones  son  necesarias  para  estimar  /a 
a  no  mas  de  .5,  con  probabilidad  igual  a  .95? 

8.84  Muestras  aleatorias  independientes  de  n,  =  50 
y  n2  =  60  observaciones  se  seleccionaron  de  las 
poblaciones  1  y  2,  respectivamente.  Los  tamanos 
muestrales  y  estadlsticas  muestrales  calculadas  se  dan 
en  la  tabla: 

Poblacion 
1  2 

Tamano  muestral  5  60 

Media  muestral  100.4  96.2 

Desviacion  muestral  estandar  0.8  1.3 

Encuentre  un  intervalo  de  confianza  de  90%  para  la 
diferencia  en  medias  poblacionales  e  interprete  el 
intervalo. 

8.85  Consulte  el  ejercicio  8.84.  Supongamos  que 
se  desea  estimar  (q,i  —  ji2)  correcta  a  no  mas  de  .2, 
con  probabilidad  igual  a  .95.  Si  planea  usar  tamanos 
muestrales  iguales,  ^que  tan  grande  deben  ser  n2  y  n{! 

8.86  Una  muestra  aleatoria  de  n  =  500  observaciones 
de  una  poblacion  binomial  produjo  x  =  240  exitos. 

a.  Encuentre  una  estimation  puntual  para  p  y  cl  margen 
de  error  para  su  estimador. 

b.  Encuentre  un  intervalo  de  confianza  de  90%  para  p. 
Interprete  este  intervalo. 

8.87  Consulte  el  ejercicio  8.86.  (',Quc  tan  grande  debe 
ser  una  muestra  si  se  desea  estimar  p  correcta  a  no  mas  de 
.025,  con  probabilidad  igual  a  .90? 

8.88  Muestras  aleatorias  independientes  de  nx  =  40 
y  n2  =  80  observaciones  se  seleccionaron  de  entre 
las  poblaciones  binomiales  1  y  2,  respectivamente.  El 
numero  de  exitos  en  las  dos  muestras  fueron  x,  =  17  y 

x2  =  23.  Encuentre  un  intervalo  de  confianza  de  99%  para 
la  diferencia  entre  las  dos  proporciones  poblacionales 
binomiales.  Interprete  este  intervalo. 

8.89  Consulte  el  ejercicio  8.88.  Supongamos  que 
se  desea  estimar  (p,  —  p2)  correcta  a  no  mas  de  .06, 
con  probabilidad  igual  a  .99  y  se  planea  usar  tamanos 
muestrales  iguales,  es  decir,  n,  =  n2.  iQue  tan  grande 
deben  ser  nt  y  n2? 

8.90  Cocina  etnica  Grupos  etnicos  en  Estados  Unidos 
compran  diferentes  cantidades  de  diversos  productos 
alimenticios  debido  a  su  cocina  etnica.  Los  asiaticos 
compran  menos  verduras  enlatadas  que  otros  grupos  y  los 
hispanoamericanos  compran  mas  aceite  de  cocina.  A  una 
investigadora  interesada  en  la  segmentation  de  mercado 
para  estos  dos  grupos  le  gustarfa  estimar  la  proporcion 

de  familias  que  seleccionan  ciertas  marcas  de  varios 
productos.  Si  la  investigadora  desea  que  estas  estimaciones 


se  encuentren  a  no  mas  de  .03  con  probabilidad  de  .95, 

(■  cuantas  familias  debe  ella  incluir  en  las  muestras? 
Suponga  que  los  tamanos  muestrales  son  iguales. 

8.91  Mujeres  en  Wall  Street  Las  mujeres  en  Wall 
Street  pueden  ganar  grandes  salarios,  pero  es  posible 
que  tengan  que  hacer  sacrificios  en  sus  vidas  personales. 
De  hecho,  muchas  mujeres  en  la  industria  de  valores 
tienen  que  hacer  sacrificios  personales  importantes.  Una 
encuesta  de  482  mujeres  y  356  hombres  encontro  que 
solo  la  mitad  de  las  mujeres  tienen  hijos,  en  comparacion 
con  tres  cuartos  de  los  hombres  encuestados.16 

a.  <\Cu  riles  son  los  valores  de  p,  y  p2  para  las  mujeres  y 
hombres  en  esta  encuesta? 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  la  proporcion  de  mujeres  y  hombres  en 
Wall  Street  que  tienen  hijos. 

c.  ^Que  conclusiones  se  pueden  sacar  respecto  a  los 
grupos  comparadas  en  el  inciso  b)? 

8.92  Fumar  y  presion  sanguinea  Se  realizo  un 
experimento  para  estimar  el  efecto  de  fumar  en  la 
presion  sanguinea  de  un  grupo  de  35  fumadores.  Se 
obtuvo  la  diferencia  para  cada  participante  al  tomar 
la  diferencia  en  las  lecturas  de  presion  sanguinea  al 
principio  del  experimento  y  otra  vez  cinco  anos  mas 
adelante.  El  aumento  de  la  media  muestral,  medido  en 
millmetros  de  mercurio,  fue  de  x  =  9.7.  La  desviacion 
estandar  muestral  fue  s  =  5.8.  Estime  el  aumento  medio 
en  presion  sanguinea  que  se  esperarla  para  fumadores 
de  cigarrillos  en  el  espacio  de  tiempo  indicado  por  el 
experimento.  Encuentre  el  margen  de  error.  Describa  la 
poblacion  asociada  con  la  media  que  haya  estimado. 

8.93  Presion  sanguinea,  continua  Con  el  uso  de  un 

coeficiente  de  confianza  igual  a  .90,  ponga  un  intervalo 
de  confianza  en  el  aumento  medio  de  presion  sanguinea 
para  el  ejercicio  8.92. 

8.94  Concentracion  de  yodo  Con  base  en 
mediciones  repetidas  de  la  concentracion  de  yodo  en 
una  solution,  un  qulmico  informa  la  concentracion 
como  4.614,  con  un  “margen  de  error  de  .006”. 

a.  (',C6mo  se  interpretarla  el  “margen  de  error”  del 
qulmico? 

b.  Si  la  concentracion  informada  se  basa  en  una  muestra 
aleatoria  de  n  =  30  mediciones,  con  una  desviacion 
muestral  estandar  s  =  .017,  ,'estarla  usted  de  acuerdo 
en  que  el  “margen  de  error”  del  qulmico  es  .006? 

8.95  Estaturas  Si  se  supone  que  las  estaturas  de 
hombres  estan  normalmente  distribuidas  con  una 
desviacion  estandar  de  2.5  pulgadas,  ^que  tan  grande 
debe  tomarse  una  muestra  para  estar  razonablemente 
seguro  (probabilidad  .95)  de  que  la  media  muestral  no 
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difiere  de  la  media  verdadera  (media  poblacional)  en  mas 
de  .50  en  valor  absolute? 

8.96  Alimento  para  polios  Un  experimentador 
alimento  con  diferentes  raciones,  A  y  B,  a  dos  grupos  de 
100  polios  cada  uno.  Suponga  que  todos  los  fac tores  que 
no  sean  raciones  son  iguales  para  ambos  grupos.  De  los 
polios  alimentados  con  la  racion  A,  13  murieron  y  de 
los  polios  alimentados  con  la  racion  B,  seis  murieron. 

a.  Construya  un  intervalo  de  confianza  de  98%  para  la 
verdadera  diferencia  en  porcentajes  de  mortalidad  para 
las  dos  raciones. 

b.  <ySe  puede  concluir  que  hay  una  diferencia  en  los 
porcentajes  de  mortalidad  para  las  dos  raciones? 

8.97  Antibioticos  Se  desea  estimar  la  production  media 
por  hora  para  un  proceso  que  manufactura  un  antibiotico. 
Se  observa  el  proceso  durante  100  periodos  de  una  hora 
escogidos  al  azar,  con  los  resultados  de  x  =  34  onzas  por 
hora  y  s  =  3.  Estime  la  production  media  por  hora  para  el 
proceso  usando  un  intervalo  de  confianza  de  95%. 

8.98  Queso  y  refrescos  El  estadounidense  promedio 
se  ha  acostumbrado  a  comer  fuera  de  casa,  en  especial 
en  restaurantes  de  comida  rapida.  En  parte  como 
resultado  de  este  habito  de  consumir  comida  rapida,  el 
consumo  per  capita  de  queso  (el  principal  ingrediente 
en  una  pizza)  y  de  bebidas  gaseosas  no  de  dieta,  ha 
aumentado  considerablemente  desde  hace  una  decada. 

Un  estudio  en  el  American  Demographics  informa  que  el 
estadounidense  promedio  consume  25.7  libras  de  queso 
y  bebe  40  galones  (o  aproximadamente  645  porciones  de 
8  onzas)  de  refrescos  no  de  dieta  al  ano.17  Para  probar  la 
precision  de  estos  promedios  publicados,  se  selecciona 
una  muestra  aleatoria  de  40  consumidores  y  se  registran 
estas  estadisticas  resumidas: 

Queso  (Ibs/ano)  Refrescos  (gal/ano) 

Media  muestral  28.1  39.2 

Desviacion  muestral  estandar  3.8  4.5 

Use  su  conocimiento  de  estimation  estadistica  para 
estimar  el  promedio  de  consumo  anual  per  capita  de 
estos  dos  productos.  (-,Esta  muestra  hace  que  usted  apoye 
o  cuestione  la  precision  de  los  promedios  reportados? 
Explique. 

8.99  Alimentation  sana  ^,No  saben  los 
estadounidenses  que  comer  pizzas  y  papas  a  la  francesa 
lleva  al  sobrepeso?  En  el  mismo  articulo  del  American 
Demographics  citado  en  el  ejercicio  8.98,  un  estudio  de 
mujeres  que  preparan  la  comida  principal  en  sus  casas 
informo  estos  resultados: 

•  90%  saben  que  la  obesidad  causa  problemas  de  salud. 

•  80%  saben  que  un  consumo  elevado  de  grasas  puede 
llevar  a  problemas  de  salud. 


•  86%  saben  que  el  colesterol  es  un  problema  de  salud. 

•  88%  saben  que  el  sodio  puede  tener  efectos  negativos 
en  la  salud. 

a.  Suponga  que  este  estudio  se  baso  en  una  muestra 
aleatoria  de  750  mujeres.  (',Que  tan  precisos  espera 
usted  que  sean  los  porcentajes  dados  lineas  antes 
al  estimar  los  porcentajes  poblacionales  reales? 
(sugerencia:  Si  estos  son  los  linicos  cuatro 
porcentajes  para  los  cuales  se  necesita  un  margen  de 
error,  una  estimation  conservadora  para  p  es  p  ~  .80.) 

b.  Si  usted  desea  aumentar  su  error  muestral  a  ±  1%, 
^que  tan  grande  debe  tomar  una  muestra? 

8.100  Girasoles  En  un  articulo  del  Annals  of  Botany, 
un  investigador  informo  los  diametros  basales  de  tallos  de 
dos  grupos  de  girasoles  dicotiledoneos:  los  que  se  dejaron 
balancearse  libremente  al  viento  y  a  los  que  se  les  aplico 
un  soporte  artificial.18  Un  experimento  similar  fue  realizado 
para  plantas  de  maiz  monocotiledoneas.  Aun  cuando  los 
autores  midieron  otras  variables  en  un  diseno  experimental 
mas  complicado,  suponga  que  cada  grupo  estuvo  formado 
por  64  plantas  (un  total  de  128  girasoles  y  128  plantas  de 
maiz).  Los  valores  indicados  en  la  tabla  siguiente  son  las 
medias  muestrales  mas  o  menos  el  error  estandar. 


Girasol 

Maiz 

Sin  soporte 

35.3  ±  .72 

16.2  ±  .41 

Con  soporte 

32.1  ±  .72 

14.6  ±  .40 

Use  sus  conocimientos  de  estimation  estadistica  para 
comparar  los  diametros  basales  de  plantas  sin  y  con 
soporte  para  las  dos  plantas.  Escriba  un  parrafo  que 
describa  sus  conclusiones,  asegurandose  de  incluir  una 
medida  de  la  precision  de  su  inferencia. 

8.101  iUna  mujer  presidents?  Durante  anos,  casi 
todos  los  estadounidenses  dicen  que  votarian  por  una 
mujer  para  presidenta  SI  fuera  apta  para  ello  y  SI  fuera 
de  su  propio  partido  politico.  Pero,  ^esta  listo  Estados 
Unidos  para  que  una  mujer  sea  su  presidenta?  Una 
encuesta  de  la  CBS/New  York  Times  hizo  esta  pregunta 
de  una  muestra  aleatoria  de  1229  personas  adultas,  con 
los  siguientes  resultados:19 


%  que  respondieron  "Si" 


Ahora 

1999 

Total 

55% 

48% 

Hombres 

60 

46 

Mujeres 

51 

49 

Republicanos 

48 

47 

Democratas 

61 

44 

Independientes 

55 

54 

a.  Construya  un  intervalo  de 

confianza  de  95%  para  la 

proportion  de  todos  los  estadounidenses  que  ahora 
piensan  que  Estados  Unidos  esta  listo  para  una  mujer 
presidenta. 
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b.  Si  hubiera  n,  =  610  hombres  y  n2  =  619  mujeres  en 
la  muestra,  construya  un  intervalo  de  confianza  de 
95%  para  la  diferencia  en  la  proporcion  de  hombres 

y  mujeres  que  ahora  piensan  que  Estados  Unidos  esta 
listo  para  una  mujer  presidenta.  (\Se  puede  concluir 
que  la  proporcion  de  hombres  que  ahora  piensan  que 
este  pais  esta  listo  para  una  mujer  presidenta  es  mayor 
que  la  proporcion  de  mujeres?  Explique. 

c.  Veamos  a  los  porcentajes  de  respuestas  “si”  para 
republicanos,  democratas  e  independientes  ahora 
comparados  con  los  porcentajes  en  1999.  i Se 
puede  pensar  en  una  razon  por  la  cual  el  porcentaje 
de  democratas  podrfa  haber  cambia  en  forma  tan 
import  ante? 

8.102  Costos  de  universidad  El  director 
administrative  de  un  colegio  para  hombres  desea  estimar 
el  costo  promedio  del  primer  ano  para  estudiantes  de 
primer  grado  en  una  universidad  particular,  correcto  a  no 
mas  de  $500,  con  una  probabilidad  de  .95.  Si  una  muestra 
aleatoria  de  estudiantes  de  primer  ano  ha  de  seleccionarse 
y  a  cada  uno  se  le  pide  llevar  datos  financieros,  ^cuantos 
deben  estar  incluidos  en  la  muestra?  Suponga  que  el 
director  solo  sabe  que  el  margen  de  gastos  va  a  variar  de 
aproximadamente  $4800  a  $13000. 

8.103  Control  de  calidad  Un  ingeniero  de  control 
de  calidad  desea  estimar  la  fraccion  de  defectos  en  un 
lote  grande  de  cartuchos  de  pellcula.  De  experiencias 
previas,  el  sabe  que  la  fraccion  real  de  defectos  debe 
estar  alrededor  de  .05.  i,Que  tan  grande  debe  tomar  una 
muestra  si  el  desea  estimar  la  verdadera  fraccion  a  no 
mas  de  .01,  usando  un  intervalo  de  confianza  de  95 %? 

8.104  Tarjetas  de  circuitos  Muestras  de  400  tarjetas 
de  circuito  impreso  se  seleccionaron  de  cada  una  de  dos 
llneas  de  produccion  A  y  B.  La  llnea  A  produjo  40 
defectuosas  y  la  B  produjo  80  defectuosas.  Estime 

la  diferencia  en  las  fracciones  reales  de  defectuosas 
para  las  dos  llneas  con  un  coeficiente  de  confianza  de  .90. 

8.105  Tarjetas  de  circuitos  II  Consul te  el  ejercicio 
8.104.  Suponga  que  10  muestras  de  n  =  400  tarjetas  de 
circuito  impreso  se  probaron  y  se  construyo  un  intervalo 
de  confianza  para  p  para  cada  una  de  las  10  muestras. 

,.'  Cual  es  la  probabilidad  de  que  exactamente  uno  de  los 
intervalos  no  contenga  el  verdadero  valor  de  pi  iY  de 
que  al  menos  un  intervalo  no  contenga  el  verdadero  valor 
de  pi 

8.106  Hockey  sobre  hielo  La  capacidad  de  acelerar 
rapidamente  es  un  atributo  importante  para  un  jugador 
de  hockey  sobre  hielo.  G.  Wayne  Marino  investigo 
algunas  de  las  variables  relacionadas  con  la  aceleracion 
y  rapidez  de  un  jugador  de  hockey  desde  una  posicion 
en  reposo.20  Sesenta  y  nueve  jugadores,  titulares  e 


intramuros,  de  la  Universidad  de  Illinois  se  incluyeron 
en  el  experimento.  A  cada  jugador  se  le  indico  que  se 
moviera  con  la  mayor  rapidez  posible  desde  una  posicion 
de  reposo,  para  recorrer  una  distancia  de  6  metros. 

Las  medias  y  desviaciones  estandar  de  algunas  de  las 
variables  registradas  para  cada  uno  de  los  69  patinadores 
se  ven  en  la  tabla  siguiente: 


Media  Desv.  Est. 


Peso  (kilogramos) 

75.270 

9.470 

Largo  de  zancada  (metros) 

1.110 

.205 

Rapidez  de  zancada  (zancada/s) 

3.310 

.390 

Promedio  de  aceleracion  (m/s2) 

2.962 

.529 

Velocidad  instantanea  (m/s) 

5.753 

.892 

Tiempo  para  patinar  (s) 

1.953 

.131 

a.  De  la  formula  que  usarla  para  construir  un  intervalo 
de  confianza  de  95%  para  una  de  las  medias 
poblacionales  (por  ejemplo,  tiempo  medio  para  patinar 
la  distancia  de  6  m). 

b.  Construya  un  intervalo  de  confianza  de  95%  para  el 
tiempo  medio  para  patinar.  Interprete  este  intervalo. 

8.107  Hockey  sobre  hielo,  continua  El  ejercicio 
8.106  presento  estadlsticas  de  un  estudio  de  arranques 
rapidos  de  patinadores  de  hockey  sobre  hielo.  La 
media  y  desviacion  estandar  de  las  69  mediciones 
individuales  de  promedio  de  aceleracion,  en  la  distancia 
de  6  metros,  fueron  2.962  y  .529  metros  por  segundo, 
respectivamente. 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  esta 
media  poblacional.  Interprete  el  intervalo. 

b.  Suponga  que  usted  no  esta  satisfecho  con  el  ancho 
de  este  intervalo  de  confianza  y  desea  cortar  el 
intervalo  a  la  mitad  al  aumentar  el  tamano  muestral. 
('.Cuantos  patinadores  (en  total)  tendrian  que  incluirse 
en  el  estudio? 

8.108  Hockey  sobre  hielo,  continua  La  media  y 
desviacion  estandar,  de  las  magnitudes  de  rapidez  de  la 
muestra  de  69  patinadores  al  final  de  la  distancia  de  6 
metros  del  ejercicio  8.106,  fueron  5.753  y  .892  metros 
por  segundo,  respectivamente. 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
velocidad  media  en  la  marca  de  6  metros.  Interprete  el 
intervalo. 

b.  Supongamos  que  usted  desea  repetir  el  experimento 
y  desea  estimar  esta  velocidad  media  a  no  mas  de  .  1 
segundos,  con  probabilidad  .99.  /.Cuantos  patinadores 
tendrian  que  incluirse  en  su  muestra? 

8.109  Trabajadores  en  escuelas  Ademas  de 
profesores  y  personal  administrativo,  las  escuelas 
tambien  tienen  otros  empleados  entre  los  que  se 
incluyen  conductores  de  autobuses  escolares,  custodios 
y  trabajadores  de  cafeterias.  El  promedio  de  salario  por 
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hora  es  $14.18  para  conductores  de  autobuses, 

$12.61  para  custodios  y  $10.33  para  trabajadores  de 
cafeterias.21  Suponga  que  un  distrito  escolar  emplea 
n  =  36  conductores  de  autobuses  que  ganan  un  prome- 
dio  de  $1 1.45  por  hora  con  una  desviacion  estandar  de 
s  =  $2.84.  Encuentre  un  intervalo  de  confianza  de  95% 
para  el  promedio  de  sueldo  por  hora  de  conductores  de 
autobuses  en  distritos  escolares  semejantes  a  este.  (:,Su 
intervalo  de  confianza  contiene  el  promedio  indicado 
de  $14.18?  ^Que  se  puede  concluir  acerca  de  salarios 
por  hora  para  conductores  de  autobuses  en  este  distrito 
escolar? 

8.110  Reincidencia  Se  utilizo  una  tecnica 
experimental  de  rehabilitacion  en  prisioneros  liberados. 
Se  demostro  que  79  de  121  hombres  sometidos  a  la 
tecnica  prosiguieron  con  vidas  utiles  y  sin  delincuencia 
durante  un  periodo  de  tres  anos  despues  de  su  liberation. 
Encuentre  un  intervalo  de  confianza  para  p,  la 
probabilidad  de  que  un  prisionero  sometido  a  la  tecnica 
de  rehabilitacion  seguira  una  vida  sin  delincuencia 
durante  al  menos  tres  anos  despues  de  ser  liberados. 

8.1 1 1  Densidad  relativa  Si  36  mediciones  de  la 
densidad  relativa  del  aluminio  tuvieron  una  media  de 
2.705  y  una  desviacion  estandar  de  .028,  construya  un 
intervalo  de  confianza  del  98%  para  la  densidad  relativa 
real  del  aluminio. 

8.112  Investigation  de  audiologfa  Enunestudio 
para  establecer  el  umbral  absoluto  de  audibilidad,  a  70 
estudiantes  hombres  de  primer  ano  de  universidad  se 
les  pidio  participaran.  Cada  individuo  fue  sentado  en  un 


cuarto  a  prueba  de  sonidos  y  se  presento  un  tono  de  150  H 
a  un  gran  numero  de  niveles  de  estfmulo  en  un  orden 
aleatorio.  A  la  persona  se  le  indico  presionara  un  boton 
si  detectaba  el  sonido;  el  experimentador  registro  el  nivel 
mas  bajo  de  estfmulo  al  cual  fue  detectado  el  tono.  La 
media  para  el  grupo  fue  de  21.6  dB  con  .v  =  2.1.  Estime 
el  umbral  medio  absoluto  para  todos  los  estudiantes 
universitarios  de  primer  ano  y  calcule  el  margen  de  error. 

8.1 13  Derecho  o  zurdo  Un  investigador  clasifico 
a  sus  sujetos  como  innatamente  derechos  o  zurdos  al 
comparar  los  anchos  de  las  uflas  de  sus  pulgares.  El 
tomo  una  muestra  de  400  hombres  y  encontro  que  80 
podrfan  clasificarse  como  zurdos  de  acuerdo  con  este 
criterio.  Estime  la  proporcion  de  todos  los  hombres  de  la 
poblacion  que  resultarfan  zurdos,  usando  un  intervalo  de 
confianza  de  95%. 

8.1 14  La  garrapata  roja  de  citricos  Una  entomologa 
desea  estimar  el  tiempo  promedio  de  desarrollo  de  la 
garrapata  roja  de  cftricos,  a  no  mas  de  .5  de  dfa. 

De  los  experimentos  previos,  se  sabe  que  cr  es  cercana 
a  los  cuatro  dfas.  (Que  tan  grande  debe  ser  la  muestra 
que  tome  la  entomologa  para  tener  95%  de  confianza  de 
su  estimacion? 

8.115  La  garrapata  roja  de  cftricos,  continua  Un 

productor  piensa  que  uno  de  cada  cinco  de  sus  arboles 
de  cftricos  esta  infectado  con  la  garrapata  roja  de  cftricos 
mencionada  en  el  ejercicio  8.1 14.  ^Que  tan  grande  debe 
ser  la  muestra  tomada  si  el  productor  desea  estimar,  a 
no  mas  de  .08,  la  proporcion  de  sus  arboles  que  estan 
infectados  con  la  garrapata  roja  de  cftricos? 


APPLET 


8.1 16  Consulte  el  applet  Interpreting  Confidence 
Intervals. 


a.  Suponga  que  se  tiene  una  muestra  aleatoria  de  tamano 
n  =  50  de  una  poblacion  con  media  p  desconocida  y 
una  desviacion  estandar  conocida  cr  =  35.  Calcule  la 
mitad  del  ancho  de  un  intervalo  de  confianza  de  95% 
para  pc.  -  Cual  serfa  el  ancho  de  este  intervalo? 


b.  Use  el  boton  para  crear  un  intervalo 

individual  de  confianza  para  pi.  (,CuaI  es  el  ancho  de 
este  intervalo?  Compare  sus  resultados  con  el  calculo 
que  hizo  en  el  inciso  a). 


8.1 17  Consulte  el  applet  Interpreting  Confidence 
Intervals. 


a.  Use  el  boton  a— 1  para  crear  10  intervalos  de 

confianza  para  p. 

b.  ^Que  observa  acerca  de  los  anchos  de  estos 
intervalos? 


c.  ^Cuantos  de  los  intervalos  funcionan  adecuadamente  y 
contienen  el  verdadero  valor  de  pi 

d.  Intente  esta  simulacion  nuevamente  al  dar  un  clic  en  el 

boton  I  unas  cuantas  veces  mas  y  contando 

el  numero  de  intervalos  que  funcionan  correctamente. 
(:,Es  cercano  a  nuestro  nivel  de  confianza  de  95%? 

8.118  Consulte  el  applet  Interpreting  Confidence 
Intervals. 

a.  Use  el  boton  i-  I  para  crear  100  intervalos  de 
confianza  para  p. 

b.  <^Que  observa  acerca  de  los  anchos  de  estos  intervalos? 

c.  ^Cuantos  de  los  intervalos  funcionan  adecuadamente  y 
contienen  el  verdadero  valor  de  pi 

d.  Intente  esta  simulacion  nuevamente  al  dar  un  clic  en  el 

boton  1 _ I  unas  cuantas  veces  mas  y  contando  el 

numero  de  intervalos  que  funcionan  correctamente. 

(:,Es  cercano  a  nuestro  nivel  de  confianza  de  95  %? 
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8.1 19  Suponga  que  se  selecciona  una  muestra  aleatoria 
de  tamano  n  con  media  /x  =  750  y  desviacion  estandar  cr. 
El  applet  Exploring  Confidence  Intervals  muestra  la 
distribucion  muestral  de  x  y  un  intervalo  de  confianza 
representative,  calculado  como 

*  ± 

a.  El  applet  se  carga  con  n  =  50,  cr  =  35  y  x  =  756. 
Calcule  la  mitad  del  ancho  de  un  intervalo  de 
confianza  de  95%  para  \x. 

b.  Calcule  los  limites  superior  e  inferior  de  confianza  y 
compare  estos  limites  contra  los  puntos  extremos  del 
intervalo  que  se  ve  en  el  applet. 

c.  /El  intervalo  de  confianza  funciona  correctamente? 
Esto  es,  /contiene  el  verdadero  valor  de  /x  =  750? 

8.120  Consulte  el  applet  Exploring  Confidence 
Intervals. 

a.  Use  el  applet  para  hallar  los  valores  de  Zen  para  un  inter¬ 
valo  de  confianza  de  99%.  /  Para  un  intervalo  de  confian¬ 
za  de  95%?  /Para  un  intervalo  de  confianza  de  90%? 

b.  /Que  efecto  tiene  reducir  el  nivel  de  confianza  sobre 
el  ancho  del  intervalo  de  confianza? 


c.  Un  intervalo  mas  angosto  indica  una  estimacion  mas 
precisa  de  /x,  formada  por  un  margen  mas  pequeno 
de  valores.  Para  obtener  una  estimacion  mas  precisa 
al  usar  un  valor  mas  pequeno  de  z,  /que  se  ha 
sacrificado? 

8.121  Consulte  el  applet  Exploring  Confidence 

Intervals. 

a.  Mueva  el  cursor  marcado  “n”  de  abajo  hacia  arriba. 

b.  /Cual  es  el  efecto  de  aumentar  el  tamano  muestral 
sobre  el  error  estandar  de  x?  /Sobre  el  ancho  del 
intervalo  de  confianza? 

c.  /Puede  usted  considerar  una  explicacion  practica  para 
los  fenomenos  que  observa  en  el  inciso  b)? 

8. 1 22  Consulte  el  applet  Exploring  Confidence 

Intervals. 

a.  Mueva  el  cursor  marcado  “sigma”  de  abajo  hacia 
arriba. 

b.  /Cual  es  el  efecto  de  aumentar  la  variabilidad  sobre  el 
error  estandar  de  xl  /Sobre  el  ancho  del  intervalo  de 
confianza? 

c.  /Puede  usted  considerar  una  explicacion  practica  para 
los  fenomenos  que  observa  en  el  inciso  b)? 


CASO 

prActico 


(Que  tan  confiable  es  esa  encuesta? 

CBS  News:  {Como  y  donde  come  el  pueblo 
de  Estados  Unidos? 


Cuando  los  estadounidenses  salen  a  comer  a  restaurantes,  muchos  de  ellos  escogen  ali- 
mentos  de  Estados  Unidos,  pero  el  gusto  por  comida  mexicana,  china  e  italiana  varfan  de 
una  region  a  otra  en  Estados  Unidos.  En  una  encuesta  telefonica  realizada  por  la  CBS2' 
del  30  de  octubre  al  1  de  noviembre  de  2005,  se  encontro  que  39%  de  las  familias  comian 
juntos  siete  noches  por  semana,  ligeramente  menos  que  el  46%  de  familias  que  dijeron 
comer  juntos  siete  dias  por  semana  en  una  encuesta  de  1990  por  la  CBS.  Casi  todos 
los  estadounidenses,  hombres  y  mujeres,  cocinan  algo  cuando  comen  en  casa,  como  lo 
informa  la  tabla  siguiente  donde  comparamos  el  numero  de  comidas  por  la  tarde,  perso- 
nalmente  cocinadas  por  semana  por  hombres  y  mujeres. 


Numero  de  comidas  cocinadas  3  o  menos  4  o  menos 


Hombres  76  24 

Mujeres  33  67 


La  frecuencia  con  la  que  los  estadounidenses  comen  en  restaurantes  es  principalmente 
una  funcion  del  ingreso.  “Mientras  que  casi  todas  las  familias  que  ganan  mas  de  $50  000 
pidieron  comida  de  restaurante  al  menos  una  vez  la  semana  pasada,  75%  de  los  que  ganan 
menos  de  $15  000  no  la  piden  en  absolute. ” 


Ingreso  Ninguna  1-3  noches  4  o  mas  noches 


Todos 

47 

49 

4 

Menos  de  $15000 

75 

19 

6 

$1 5-$30  000 

58 

39 

3 

$30-$50  000 

59 

38 

3 

Mas  de  $50000 

31 

64 

5 
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A  pesar  de  toda  la  publicidad  negativa  acerca  de  la  obesidad  y  altas  calorfas  asociadas  con 
hamburguesas  y  papas  fritas,  muchos  estadounidenses  continuan  consumiendo  comida 
rapida  para  ahorrar  tiempo  dentro  de  sus  apretadas  agendas. 

Noches  de  comida  rapida  0  1  2-3  4+ 

Con  ninos  47  30  19  4 

Sin  ninos  59  20  16  5 

Noches  de  comida  rapida  0  1  2-3  4+ 

Hombres  46  28  20  6 

Mujeres  63  20  15  2 

Cincuenta  y  tres  por  ciento  de  familias  con  ninos  consumieron  comida  rapida  al  menos 
una  vez  la  semana  pasada,  comparado  con  el  41%  de  familias  sin  hijos.  Ademas,  54% 
de  los  hombres  consumieron  comida  rapida  al  menos  una  vez  la  semana  pasada,  en 
comparacion  con  solo  37%  de  las  mujeres. 

La  description  de  los  metodos  de  encuesta  que  dio  lugar  a  estos  datos  se  expreso  como 
sigue: 

“Esta  encuesta  fue  realizada  a  nivel  nacional  entre  una  muestra  aleatoria  de  936  adultos, 
entrevistados  por  telefono  del  30  de  octubre  al  1  de  noviembre,  2005.  El  error  debido  al 
muestreo  para  resultados  basados  en  toda  la  muestra  podria  ser  mas  o  menos  tres  puntos 
porcentuales.  ” 

1.  Verifique  el  margen  de  error  de  ±  3  puntos  porcentuales  como  lo  indica  la  muestra 
de  n  =  936  adultos.  Suponga  que  la  muestra  contenida  en  igual  numero  de  hombres  y 
mujeres,  o  468  hombres  y  468  mujeres.  ^Cual  es  el  margen  de  error  para  hombres 
y  para  mujeres? 

2.  Los  numeros  de  las  tablas  indican  el  numero  de  personas/familias  en  las  categories?  Si 
no  es  asl,  ^que  representan  esos  numeros? 

3.  a.  Construya  un  intervalo  de  confianza  de  95%  para  las  proporciones  de  estadouni¬ 

denses  que  comieron  juntos  siete  noches  por  semana. 

b.  Construya  un  intervalo  de  confianza  de  95%  para  la  diferencia  en  la  proporcion  de 
mujeres  y  hombres  que  personalmente  cocinan  al  menos  cuatro  o  mas  comidas  por 
semana. 

c.  Construya  un  intervalo  de  confianza  de  95%  para  la  proporcion  de  estadounidenses 
que  comen  en  restaurantes  al  menos  una  vez  a  la  semana. 

4.  Si  estas  preguntas  se  formulan  ahora,  ^esperarfa  usted  que  las  respuestas  fueran  simi- 
lares  a  las  publicadas  aquf,  o  esperarfa  usted  que  difieran  en  forma  significativa? 
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Pruebas  de 
hipotesis 
de  muestras 
grandes 


OBJETIVOS  GENERALES 

En  este  capitulo,  el  concepto  de  una  prueba  estadistica 
de  hipotesis  se  introduce  de  manera  formal.  Las  distri- 
buciones  muestrales  de  estadlsticos  presentadas  en  los 
capitulos  7  y  8,  se  usan  para  construir  pruebas  de  mues- 
tra  grande  respecto  a  los  valores  de  parametros  poblacio- 
nales  de  interes  para  el  experimentador. 


IN  DICE  DEL  CAPITULO 

Prueba  de  muestras  grandes  alrededor  de  (p,  -  ^  (9.4) 

Prueba  de  muestras  grandes  alrededor  de  una  media 
poblacional  p,  (9.3) 

Una  prueba  estadistica  de  hipotesis  (9.2) 

Prueba  de  una  hipotesis  alrededor  de  (p,  -  p2)  (9.6) 

Prueba  de  una  hipotesis  alrededor  de  una  proporcion 
poblacional  p  (9.5) 


ENTRENADOR  PERSONAL 


Regiones  de  rechazo,  valores  p  y  conclusiones 
iComo  calculo  /8? 


©  Valentyn75/Dreamstime 


TtUna  aspirina  al  dla...? 

^Una  aspirina  reduce  el  riesgo  de  ataque  cardia- 
co?  Un  estudio  muy  grande  de  medicos  de  Esta- 
dos  Unidos  demostro  que  una  sola  aspirina  tomada 
en  dfas  alternados  redujo  a  la  mitad  un  ataque  al 
corazon  en  hombres.  No  obstante,  tres  dfas  des¬ 
pues,  un  estudio  hecho  en  Inglaterra  informo  de 
una  conclusion  completamente  opuesta.  yComo 
puede  ser  esto?  El  estudio  practico  al  bnal  de  este 
capitulo  observa  la  forma  en  que  se  realizaron  los 
estudios  y  usted  analizara  los  datos  usando  tecni- 
cas  de  muestras  grandes. 
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PRUEBA  DE  HIPOTESIS  ACERCA 
DE  parAmetros  POBLACIONALES 

En  situaciones  practicas,  una  inferencia  estadfstica  puede  comprender  la  estimacion 
de  un  parametro  poblacional  o  tomar  decisiones  acerca  del  valor  del  parametro.  Por 
ejemplo,  si  una  companfa  farmaceutica  esta  fermentando  un  tanque  de  antibiotico,  se 
pueden  usar  muestras  del  tanque  para  estimar  la  potencia  media  p  para  todo  el  anti¬ 
biotico  del  tanque.  En  contraste,  suponga  que  la  companfa  no  se  interesa  en  la  potencia 
media  exacta  del  antibiotico,  sino  solo  satisfacer  los  estandares  de  potencia  mfnimos  del 
gobierno.  Entonces  la  companfa  puede  usar  muestras  del  tanque  para  decidir  entre  estas 
dos  posibilidades: 


•  La  potencia  media  jx  no  excede  la  potencia  minima  permisible. 

•  La  potencia  media  fx  excede  la  potencia  minima  permisible. 


El  problema  de  la  companfa  farmaceutica  ilustra  una  prueba  estadfstica  de  hipotesis. 

El  razonamiento  empleado  en  una  prueba  estadfstica  de  hipotesis  es  similar  al  pro- 
ceso  en  un  tribunal.  Al  procesar  a  una  persona  por  robo,  el  tribunal  debe  decidir  entre 
inocencia  y  culpabilidad.  Cuando  el  juicio  se  inicia,  se  supone  que  la  persona  acusa- 
da  es  inocente.  El  proceso  recaba  y  presenta  toda  evidencia  disponible  en  un  intento 
para  contradecir  la  hipotesis  de  inocencia  y  por  tanto  obtener  una  condena.  Si  hay  eviden¬ 
cia  suficiente  contra  inocencia,  el  tribunal  rechazara  la  hipotesis  de  inocencia  y  declarara 
culpable  al  demandado.  Si  el  proceso  no  presenta  suficiente  evidencia  para  demostrar 
que  el  demandado  es  culpable,  el  tribunal  le  hallara  no  culpable.  Observe  que  esto  no 
demuestra  que  el  demandado  es  inocente,  sino  solo  que  no  hubo  evidencia  suficiente 
para  concluir  que  el  demandado  era  culpable. 

Empleamos  este  mismo  tipo  de  razonamiento  para  explicar  los  conceptos  basicos  de 
prueba  de  hipotesis.  Estos  conceptos  se  utilizan  para  probar  los  cuatro  parametros  pobla- 
cionales  expuestos  en  el  capftulo  8:  una  sola  media  poblacional  o  proporcion  (fxop)y  la 
diferencia  entre  dos  medias  poblacionales  o  proporciones  ip.  —  p2o  Pi  ~  Pi)-  Cuando 
los  tamanos  muestrales  son  grandes,  los  estimadores  puntuales  para  cada  uno  de  estos 
cuatro  parametros  tienen  distribuciones  muestrales  normales,  de  modo  que  las  cuatro 
pruebas  estadfsticas  de  muestras  grandes  siguen  el  mismo  modelo  general. 


UNA  PRUEBA  ESTADISTICA  DE  HIPOTESIS 

Una  prueba  estadfstica  de  hipotesis  esta  formada  de  cinco  partes: 


1 .  La  hipotesis  nula,  denotada  por  H0 

2.  La  hipotesis  alternativa,  denotada  por  Hd 

3.  El  estadfstico  de  prueba  y  su  valor  p 

4.  La  region  de  rechazo 

5.  La  conclusion 


Cuando  se  especifiquen  estos  cinco  elementos,  se  define  una  prueba  particular;  cambiar 
una  o  mas  de  las  partes  crea  una  nueva  prueba.  Veamos  con  mas  detalle  cada  parte  de  la 
prueba  estadfstica  de  hipotesis. 


Definicion  Las  dos  hipotesis  en  competencia  son  la  hipotesis  alternativa  gene- 
1-2  ralmente  la  hipotesis  que  el  investigador  desea  apoyar  y  la  hipotesis  nula  H0,  una  con- 
tradiccion  de  la  hipotesis  alternativa. 
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S' - -N 

Como  pronto  veremos,  es  mas  facil  presentar  apoyo  para  la  hipotesis  alternativa  al 
demostrar  que  la  hipotesis  nula  es  falsa.  En  consecuencia,  el  investigador  estadistico 
siempre  empieza  por  suponer  que  la  hipotesis  nula  H0  es  verdadera.  El  investigador  uti- 
liza  entonces  los  datos  muestrales  para  decidir  si  la  evidencia  esta  a  favor  de  Ha  mas  que 
de  Hq  y  saca  una  de  dos  conclusiones: 

•  Rechaza  H0  y  concluye  que  Hd  es  verdadera. 

•  Acepta  (no  rechaza)  H0  como  verdadera. 

EJEMPLO  9.1 

Se  desea  demostrar  que  el  promedio  de  salario  por  hora  de  carpinteros  en  el  estado  de 
California  es  diferente  de  $14,  que  es  el  promedio  nacional.  Esta  es  la  hipotesis  alterna¬ 
tiva,  escrita  como 

2 

H, :  /jl  =/=  14 

La  hipotesis  nula  es 

1 

H0  :  p  =  14 

A  usted  le  gustarfa  rechazar  la  hipotesis  nula,  con  lo  que  concluye  que  la  media  en  Cali¬ 
fornia  no  es  igual  a  $14. 

EJEMPLO 

Un  proceso  de  maquinado  produce  un  promedio  de  3%  de  piezas  defectuosas.  Usted  esta 
interesado  en  demostrar  que  un  simple  ajuste  en  una  maquina  reducira  p,  la  proporcion 
de  piezas  defectuosas  producidas  en  el  proceso  de  maquinado.  Entonces,  la  hipotesis 
alternativa  es 

2 

H, :  p  <  .03 

y  la  hipotesis  nula  es 

1 

H0 :  p  =  .03 

Si  puede  rechazar  H0,  se  puede  concluir  que  el  proceso  ajustado  produce  menos  de  3% 
de  piezas  defectuosas. 

CONSEJO 

Dos  colas  <=>  buscar  un  signo 
+  en  Wa. 

Una  cola  «  buscar  un  signo 
>  o  <  en  Ha. 

Hay  una  diferencia  en  las  formas  de  la  hipotesis  alternativa  dada  en  los  ejemplos  9.1 
y  9.2.  En  el  ejemplo  9.1,  no  se  sugiere  diferencia  direccional  para  el  valor  de  p:  esto  es, 
p  podrfa  ser  mayor  o  menor  que  $14  si  Hd  es  verdadera.  Este  tipo  de  prueba  se  denomina 
prueba  de  hipotesis  de  dos  colas.  En  el  ejemplo  9.2,  no  obstante,  estamos  especffica- 
mente  interesados  en  detectar  una  diferencia  direccional  en  el  valor  de  p:  esto  es,  si  //a 
es  verdadera,  el  valor  de  p  es  menor  a  .03.  Este  tipo  de  prueba  se  denomina  prueba  de 
hipotesis  de  una  cola. 

La  decision  de  rechazar  o  aceptar  la  hipotesis  nula  esta  basada  en  informacion  con- 
tenida  en  una  muestra  sacada  de  la  poblacion  de  interes.  Esta  informacion  toma  estas 
formas: 

3 

•  Estadistica  de  prueba:  un  solo  mimero  calculado  a  partir  de  los  datos  muestrales 

•  Valor  p:  probabilidad  calculada  usando  la  prueba  estadistica 

Cualquiera  de  estas  mediciones,  o  ambas,  actuan  como  quienes  toman  decisiones  para  el 
investigador  al  decidir  si  rechazar  o  aceptar  H0. 
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Para  la  prueba  de  hipotesis  del  ejemplo  9.1,  el  promedio  de  salario  por  hora  x  para  una 
muestra  aleatoria  de  cien  carpinteros  en  California  podria  dar  un  buen  estadistico  de 
prueba  para  probar 


H0:  i u,  =  14  contra  //a :  p  =f=  14 


3 


Si  la  hipotesis  nula  H0  es  verdadera,  entonces  la  media  muestral  no  debe  estar  demasiado 
lejana  de  la  media  poblacional  p  =  14.  Suponga  que  esta  muestra  produce  una  media 
muestral  x  con  desviacion  estandar  s  =  2.  yEs  probable  o  improbable  que  ocurra  esta 
evidencia  muestral,  si  en  realidad  H0  es  verdadera?  Se  pueden  usar  dos  medidas  para 
averiguarlo.  Como  el  tamano  muestral  es  grande,  la  distribucion  muestral  de  x  es  aproxi- 
madamente  normal  con  media  p  =  14  y  error  estandar  a/Vn,  estimada  como 


SE  = 


=  .2 


Vn  \/T00 

El  estadistico  de  prueba  3c  =  15  esta  a 


z  = 


a/Vn 


15  -  14 

.2 


=  5 


desviaciones  estandar  de  la  media  poblacional  p. 

•  El  valor  p  es  la  probabilidad  de  observar  un  estadistico  de  prueba  tanto  o  mas 
extremo  que  el  valor  observado,  si  en  realidad  H0  es  verdadera.  Para  este  ejem¬ 
plo,  definimos  “extremo”  tan  abajo  o  tan  arriba  de  lo  que  hubieramos  esperado. 
Esto  es. 


valor  p  =  P(z  >  5)  +  P(z  <  —5)  ~  0 

El  valor  grande  del  estadistico  de  prueba  y  el  valor  p  pequeno  quieren  decir  que  se  ha 
observado  un  evento  muy  poco  probable,  si  en  realidad  H0  es  verdadera  y  p  =  14. 


^Como  se  decide  si  rechazar  o  aceptar  H01  Todo  el  conjunto  de  valores  que  pueda 
tomar  el  estadistico  de  prueba  se  divide  en  dos  conjuntos  o  regiones.  Un  conjunto,  for- 
4  mado  de  valores  que  apoyan  la  hipotesis  alternativa  y  llevan  a  rechazar  H0,  se  denomina 
region  de  rechazo.  El  otro,  formado  de  valores  que  apoyan  la  hipotesis  nula,  recibe  el 
nombre  de  region  de  aceptacion. 

Por  ejemplo,  en  el  ejemplo  9.1,  uno  estaria  inclinado  a  creer  que  el  promedio  de 
salario  por  hora  en  California  fuera  diferente  de  $14  si  la  media  muestral  es  mucho 
menor  de  $14  o  mucho  mayor  de  $14.  La  region  de  rechazo  de  dos  colas  esta  formada 
por  valores  muy  pequenos  y  muy  grandes  de  3c,  como  se  ve  en  la  hgura  9.1.  En  el 
ejemplo  9.2,  como  se  desea  demostrar  que  el  porcentaje  de  defectos  ha  disminuido, 
estariamos  inclinados  a  rechazar  H0  para  valor  de  p  que  sean  mucho  menores  a  .03. 
Solo  valores  pequefios  de  p  pertenecen  a  la  region  de  rechazo  de  cola  izquierda  que 
se  ilustra  en  la  hgura  9.2.  Cuando  la  region  de  rechazo  esta  en  la  cola  izquierda  de  la 
distribucion,  la  prueba  se  llama  prueba  de  cola  izquierda.  Una  prueba  con  su  region 
de  rechazo  en  la  cola  derecha  recibe  el  nombre  de  prueba  de  cola  derecha. 


FIGURA  9.1 

Regions  de  rechazo  y 
aceptacion  para  el 
ejemplo  9.1 


Region  de 

Region  de 

Region  de 

rechazo 

aceptacion 

i 

rechazo 

Valor  crftico - 

$14 

—  Valor  crftico 
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FIGURA  9.2 


Regionns  de  rechazo  y 
aceptacion  para  el 

— W 

Region  de  ; 

rechazo  J 

Region  de 
aceptacion 
l 

ejemplo  9.2 

i 

Valor  crftico  - 1 

.03 

Si  el  estadfstico  de  prueba  cae  en  la  region  de  rechazo,  entonces  se  rechaza  la  hipote- 
sis  nula.  Si  el  estadfstico  de  prueba  cae  en  la  region  de  aceptacion,  entonces  la  hipotesis 
nula  se  acepta  o  la  prueba  se  juzga  como  no  concluyente.  Vamos  a  aclarar  los  diferentes 
tipos  de  conclusiones  que  son  apropiados  cuando  consideremos  varios  ejemplos  practi- 
cos  por  prueba  de  hipotesis. 

Por  ultimo,  ^como  se  decide  sobre  los  valores  crfticos  que  separan  las  regiones  de 
aceptacion  y  rechazo?  Es  decir,  ^como  se  decide  cuanta  evidencia  estadfstica  se  necesita 
antes  de  rechazar  H01  Esto  depende  de  la  cantidad  de  confianza  que  el  investigador  desea 
unir  a  las  conclusiones  de  prueba  y  el  nivel  de  significancia  a,  el  riesgo  que  estemos 
dispuestos  a  tomar  si  se  toma  una  decision  incorrecta. 


Definicion  Un  error  tipo  I  para  una  prueba  estadfstica  es  el  error  de  rechazar  la 
hipotesis  nula  cuando  es  verdadera.  El  nivel  de  significancia  (nivel  de  significancia) 
para  una  prueba  estadfstica  de  hipotesis  es 

a  =  Pferror  tipo  I)  =  P( rechazar  falsamente  H0)  =  P( rechazar  H0  cuando  es  ver¬ 
dadera) 


Este  valor  a  representa  el  mdximo  riesgo  tolerable  de  rechazar  incorrectamente  H0. 
Una  vez  fijo  este  nivel  de  significancia,  la  region  de  rechazo  se  puede  fijar  para  permitir 
que  el  investigador  rechace  H0  con  un  grado  fijo  de  confianza  en  la  decision. 

En  la  siguiente  seccion,  mostraremos  como  usar  una  prueba  de  hipotesis  para  probar 
el  valor  de  una  media  poblacional  /x.  Cuando  continuemos,  aclararemos  algunos  de  los 
detalles  computacionales  y  agregaremos  algunos  conceptos  adicionales  para  completar 
la  comprension  de  las  pruebas  de  hipotesis. 


UNA  PRUEBA  DE  MUESTRA  GRANDE 
ACERCA  DE  UNA  MEDIA  POBLACIONAL 

Considere  una  muestra  aleatoria  de  n  mediciones  sacadas  de  una  poblacion  que  tiene 
media  /j.  y  desviacion  estandar  er.  Se  desea  probar  una  hipotesis  de  la  forma' 


1  H0:  /a  =  /x  o 


CONSEJO 


donde  /x0  es  algun  valor  hipotetico  para  jx,  contra  una  hipotesis  alternativa  de  una  cola: 


La  hipotesis  nula 

siempre  tendra  signo  *  ■  A1  '>  M'O 

"igual  a". 

El  subfndice  cero  indica  el  valor  del  parametro  especificado  por  H0.  Observe  que  H0 
da  un  valor  exacto  para  el  parametro  a  probar,  mientras  que  //a  da  un  rango  de  posibles 
valores  para  fx. 


Observe  que  si  la  prueba  rechaza  la  hipotesis  nula  /jl  =  /jlq  a  favor  de  la  hipotesis  alternativa  fi.  >  fi0,  entonces 
ciertamente  rechazara  una  hipotesis  nula  que  incluye  /a  <  /jl0,  porque  esto  es  incluso  mas  contradictorio  para  la 
hipotesis  alternativa.  Por  esta  razon,  en  este  texto  indicamos  la  hipotesis  nula  para  una  prueba  de  una  cola  como 
fi  =  /jlq  y  no  como  fi  ^  fjL0. 
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3 


4 


Lo  esencial  de  la  prueba 

La  media  muestral  3c  es  la  mejor  estimation  del  valor  real  de  yu,  que  esta  por  ahora 
en  cuestion.  <^Que  valores  de  x  le  llevarfan  a  pensar  que  H0  es  falsa  y  yu,  es,  de  hecho, 
mayor  que  el  valor  hipotetico?  Los  valores  de  3c  que  son  extremadamente  grandes 
implicarfan  que  yu,  es  mayor  que  lo  hipotetico.  En  consecuencia,  debe  rechazarse  H0  si 
3c  es  demasiado  grande. 

El  siguiente  problema  es  debnir  lo  que  signibca  “demasiado  grande”.  No  es  probable 
que  ocurran  valores  de  3c  que  se  encuentren  a  demasiadas  desviaciones  estandar  a  la 
derecha  de  la  media.  Por  tanto,  se  puede  debnir  “demasiado  grande”  como  estar  a  dema¬ 
siadas  desviaciones  estandar  de  yu0.  Pero,  (',que  es  “demasiado”?  Esta  pregunta  puede 
contestarse  usando  el  nivel  de  significance  a ,  la  probabilidad  de  rechazar  H0  cuando  H0 
es  verdadera. 

Recuerde  que  el  error  estandar  de  3c  se  estima  como 


Como  la  distribucion  muestral  de  la  media  muestral  3c  es  aproximadamente  normal 
cuando  n  es  grande,  el  numero  de  desviaciones  estandar  que  3c  esta  desde  /x0  se  puede 
medir  usando  el  estadistico  estandarizado  de  prueba, 


_  _  X  -  /JLq 

Z  s/Vn 

que  tiene  una  distribucion  estandar  normal  cuando  H0  es  verdadera  y  /jl,,  es  verdadera  y 
yu,  =  yUo.  El  nivel  de  signibcancia  a  es  igual  al  area  bajo  la  curva  normal  que  se  encuentra 
arriba  de  la  region  de  rechazo.  Entonces,  si  se  desea  a  =  .01,  se  rechazara  H0  cuando  x 
se  encuentre  a  mas  de  2.33  desviaciones  estandar  a  la  derecha  de  yu0.  De  manera  equiva- 
lente,  se  rechazara  H0  si  el  estadistico  de  prueba  estandarizado  z  es  mayor  a  2.33  (vease 
la  bgura  9.3). 


FIGURA  9.3 

Region  de  rechazo  para 
una  prueba  de  cola 
derecha  con  a  =  .01 


El  promedio  semanal  de  ganancias  para  trabajadoras  sociales  es  $670.  <:,Los  hombres  de 
la  misma  position  tienen  ganancias  semanales  promedio  mas  altas  que  los  de  las  muje- 
res?  Una  muestra  aleatoria  de  n  =  40  trabajadores  sociales  mostro  3c  =  $725  y  s  =  $102. 
Pruebe  la  hipotesis  apropiada  usando  a  =  .01. 
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CONSEJO 


Para  pruebas  de  una 
cola,  busque  palabras 
direccionales  como 
"mayor",  "menor 

1-2 

"mas  bajo",  etcetera. 


3 


4 


5 


CONSEJO 


Si  la  prueba  es  de  dos 
colas,  no  se  vera  ninguna 
palabra  direccional.  El 
experimentador  solo  estara 
buscando  una  "diferencia" 
respecto  al  valor  hipotetico. 


FIGURA  9.4 

Region  de  rechazo  para 
una  prueba  de  dos  colas 
con  a  =  .01 


Solucion  A  usted  le  gustarfa  demostrar  que  el  promedio  semanal  de  ganancias  para 
hombres  es  mayor  a  $670,  que  es  el  promedio  de  las  mujeres.  En  consecuencia,  si  p  es  el 
promedio  semanal  de  ganancias  para  trabajadores  sociales  de  sexo  masculino,  se  puede 
demostrar  la  prueba  formal  de  hipotesis  en  pasos: 

Hipotesis  nula  y  alternativa: 

Hq\  p  =  670  contra  //a:  p  >  670 

Estadistica  de  prueba:  Usando  la  informacion  muestral,  con  a  como  estimation  de  la 
desviacion  poblacional  estandar,  calcule 

_  x  —  670  .  725  -  670  —  ^  41 
s/Vn  102/V40 

Region  de  rechazo:  Para  esta  prueba  de  una  cola,  valores  de  x  mucho  mayores  a 
670  llevarfan  a  rechazar  H0\  o  bien,  lo  que  es  equivalente,  a  valores  del  estadistico  de 
prueba  estandarizado  z  en  la  cola  derecha  de  la  distribucion  estandar  normal.  Para  con- 
trolar  el  riesgo  de  tomar  una  decision  incorrecta  cuando  a  =  .01,  se  debe  establecer  el 
valor  critico  que  separe  las  regiones  de  rechazo  y  aceptacion  para  que  el  area  de  la  cola 
derecha  sea  exactamente  a  =  .01.  Este  valor  se  encuentra  en  la  tabla  3  del  apendice  I 
como  z  =  2.33,  como  se  ve  en  la  bgura  9.3.  La  hipotesis  nula  sera  rechazada  si  el  valor 
observado  del  estadistico  de  prueba,  z,  es  mayor  a  2.33. 

Conclusion:  Compare  el  valor  observado  del  estadistico  de  prueba,  z  =  3.41,  con  el 
valor  critico  necesario  para  rechazo,  z  =  2.33.  Como  el  valor  observado  del  estadistico  de 
prueba  cae  en  la  region  de  rechazo,  se  puede  rechazar  H0  y  concluir  que  el  promedio  sema¬ 
nal  de  ganancia  para  trabajadores  sociales  de  sexo  masculino  es  mas  alta  que  el  promedio 
para  trabajadoras.  La  probabilidad  de  que  se  tome  una  decision  incorrecta  es  a  =  .01. 


Si  se  desea  detectar  desviaciones  mayores  o  menores  a  p0,  entonces  la  hipotesis  alter¬ 
nativa  es  de  dos  colas ,  escrita  como 

Ha:  p  =£  p0 

lo  cual  implica  que  ya  sea  p  >  p0  o  que  p  <  p0.  Valores  de  x  que  sean  “demasiado 
grandes”  o  “demasiado  pequenos”  en  terminos  de  su  distancia  desde  p0  se  colocan  en  la 
region  de  rechazo.  Si  se  escoge  a  =  .01,  el  area  de  la  region  de  rechazo  se  divide  igual- 
mente  entre  las  dos  colas  de  la  distribucion  normal,  como  se  ve  en  la  bgura  9.4.  Con  el 
uso  del  estadistico  de  prueba  estandarizado  z,  se  puede  rechazar  H0  si  z  >  2.58  o  z  < 
—2.58.  Para  valores  diferentes  de  a,  los  valores  crfticos  de  z  que  separan  las  regiones  de 
rechazo  y  aceptacion  cambiaran  de  conformidad. 
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ejemplo  La  production  diaria  para  una  planta  qufmica  local  ha  promediado  880  toneladas  en  los 

ultimos  anos.  A  la  gerente  de  control  de  calidad  le  gustarfa  saber  si  este  promedio  ha  cam- 
biado  en  meses  recientes.  Ella  selecciona  al  azar  50  dfas  de  entre  la  base  de  datos  y  calcula 
el  promedio  y  desviacion  estandar  de  las  n  =  50  producciones  como  3c  =  871  toneladas  y 
j  =  21  toneladas,  respectivamente.  Pruebe  la  hipotesis  apropiada  usando  a  =  .05. 


Solucion 

1-2  Hipotesis  nula  y  alternativa: 


Hq\  [a  =  880  contra  Ha:  /a  A  880 


3 


4 


5 


Estadistico  de  prueba:  La  estimation  puntual  para  /a  es  x.  Por  tanto,  la  estadistica  de 
prueba  es 


*  -  /U  =  871  -  880 

s/vTr  21/V50 


-3.03 


Region  de  rechazo:  Para  esta  prueba  de  dos  colas  se  usan  valores  de  z  en  las  colas 
derecha  e  izquierda  de  la  distribution  estandar  normal.  Usando  a  =  .05,  los  valores  cri- 
ticos  que  separan  las  regiones  de  rechazo  y  aceptacion  cortan  areas  de  a/2  =  .025  en  las 
colas  derecha  e  izquierda.  Estos  valores  son  z—  ±  1 .96  y  la  hipotesis  nula  sera  rechazada 
si  z  >  1.96  o  z  <  - 1.96. 


Conclusion:  Como  z  =  —3.03  y  el  valor  calculado  de  z  cae  en  la  region  de  rechazo,  la 
gerente  puede  rechazar  la  hipotesis  nula  de  que  /a  =  880  toneladas  y  concluir  que  ha  cam- 
biado.  La  probabilidad  de  rechazar  H0  cuando  H0  es  verdadera  y  a  =  .05,  una  probabilidad 
bastante  pequena.  Por  tanto,  ella  esta  razonablemente  segura  que  su  decision  es  correcta. 
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Suposiciones:  Las  n  observaciones  de  la  muestra  se  seleccionan  al  azar  de  entre  la 
poblacion  y  n  es  grande,  por  ejemplo,  n  >  30. 


Calculo  del  valor  p 

En  los  ejemplos  previos,  la  decision  de  rechazar  o  aceptar  H0  se  tomo  al  comparar  el 
valor  calculado  del  estadistico  de  prueba  con  un  valor  crftico  de  z  basado  en  el  nivel  de 
significancia  a  de  la  prueba.  No  obstante,  diferentes  niveles  de  significancia  pueden  lle- 
var  a  diferentes  conclusiones.  Por  ejemplo,  si  en  una  prueba  de  cola  derecha,  el  estadis¬ 
tico  de  prueba  es  z  =  2.03,  se  puede  rechazar  H0  al  nivel  de  significancia  de  5%  porque 
el  estadistico  de  prueba  excede  de  z  =  1.645.  Sin  embargo,  no  se  puede  rechazar  H0  al 
nivel  de  significancia  de  1%  porque  el  estadistico  de  prueba  es  menor  a  z  =  2.33  (vease 
la  figura  9.5).  Para  evitar  ambigiiedades  en  las  conclusiones,  algunos  experimentadores 
prefieren  usar  un  nivel  de  significancia  variable  llamada  valor  p  para  la  prueba. 


Definicion  El  valor p  o  nivel  de  significancia  observado  de  una  prueba  estadistica 
es  el  valor  mas  pequeno  de  a  para  el  cual  H0  se  puede  rechazar.  Es  el  riesgo  real  de 
cometer  un  error  tipo  I,  si  H0  es  rechazada  con  base  en  el  valor  observado  del  estadistico 
de  prueba.  El  valor  p  mide  la  fuerza  de  la  evidencia  contra  H0. 


En  la  prueba  de  cola  derecha  con  estadistica  observada  de  prueba  z  =  2.03,  el  valor  crf¬ 
tico  mas  pequeno  que  se  puede  usar  y  todavia  rechazar  H0  es  z  =  2.03.  Para  este  valor 
crftico,  el  riesgo  de  una  decision  incorrecta  es 

P(z  >  2.03)  =  1  -  .9788  =  .0212 

Esta  probabilidad  es  el  valor  p  para  la  prueba.  Observe  que  es  en  realidad  el  area  a  la 
derecha  del  valor  calculado  del  estadistico  de  prueba. 


FIGURA  9.5 

Regiones  variables  de 
rechazo 


CONSEJO 


Valor  p  =  area  de  cola  (una 
o  dos  colas)  "mas  alia" 
del  valor  observado  del 
estadistico  de  prueba. 


Un  valor  p  pequeno  indica  que  el  valor  observado  del  estadistico  de  prueba  se 
encuentra  alejado  del  valor  hipotetico  de  /x.  Esto  presenta  fuerte  evidencia  de  que  H0  es 
falsa  y  debe  ser  rechazada.  Valores  de  p  grandes  indican  que  la  estadistica  observada 
de  prueba  no  esta  alejada  de  la  media  hipotetica  y  no  apoya  el  rechazo  de  H0.  (iQue  tan 
pequeno  necesita  ser  el  valor  p  antes  que  H0  pueda  ser  rechazada? 
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E  J  E  M  P  L 


E  J  E  M  P  L 


Definicion  Si  el  valor  p  es  menor  o  igual  a  un  nivel  de  significancia  a  asignado 
previamente,  entonces  la  hipotesis  nula  puede  ser  rechazada  y  se  puede  informar  que  los 
resultados  son  estadfsticamente  significativos  al  nivel  a. 


En  el  ejemplo  previo,  si  se  escoge  a  =  .05  como  nivel  de  significancia,  H0  puede  ser 
rechazada  porque  el  valor  p  es  menor  a  .05.  No  obstante,  si  se  escoge  a  =  .01  como 
nivel  de  significancia,  el  valor  p  (.0212)  no  es  suficientemente  pequeno  para  permitir 
el  rechazo  de  H0.  Los  resultados  son  significativos  al  nivel  de  5%,  pero  no  al  de  1%. 
Pueden  verse  estos  resultados  publicados  en  revistas  profesionales  como  (p  <  .05)  sig¬ 
nificative).  ' 

Consulte  el  ejemplo  9.5.  La  gerente  de  control  de  calidad  desea  saber  si  la  produccion 
diaria  en  una  planta  qufmica  local,  que  ha  promediado  880  toneladas  en  los  ultimos  anos, 
ha  cambiado  en  anos  recientes.  Una  muestra  aleatoria  de  50  dfas  da  una  produccion 
promedio  de  871  toneladas  con  desviacion  estandar  de  21  toneladas.  Calcule  el  valor  p 
para  esta  prueba  de  hipotesis  de  dos  colas.  Use  el  valor  p  para  sacar  conclusiones  con 
respecto  a  la  prueba  estadfstica. 


Solucion  La  region  de  rechazo  para  esta  prueba  de  hipotesis  de  dos  colas  se  encuen- 
tra  en  ambas  colas  de  la  distribucion  normal  de  probabilidad.  Como  el  valor  observado 
del  estadfstico  de  prueba  es  z  =  “3.03,  la  region  de  rechazo  mas  pequena  que  se  puede 
usar  y  todavfa  rechazar  H0  es  |z|  >  3.03.  Para  esta  region  de  rechazo,  el  valor  de  a  es  el 
valor  p: 


Valor  p  =  P(z  >  3.03)  +  P(z  <  -3.03)  =  (1  -  .9988)  +  .0012  =  .0024 


Observe  que  el  valor  p  de  dos  colas  es  en  realidad  dos  veces  el  area  de  cola  correspon- 
diente  al  valor  calculado  de  la  estadistica  de  prueba.  Si  este  valor  p  =  .0024  es  menor  o 
igual  al  nivel  de  significancia  a  asignado  previamente,  H0  puede  ser  rechazada.  Para  esta 
prueba,  se  puede  rechazar  H0  ya  sea  al  nivel  de  signification  de  1%  o  de  5%. 


Si  el  investigador  esta  leyendo  un  informe  de  investigation,  £que  tan  pequeno  debe 
ser  el  valor  p  antes  que  se  decida  a  rechazar  H01  Numerosos  investigadores  usan  una 
“escala  de  calculo”  para  clasificar  sus  resultados. 

•  Si  el  valor  p  es  menor  a  .01,  H0  se  rechaza.  Los  resultados  son  altamente  signifi¬ 
cativos. 

•  Si  el  valor  p  esta  entre  .01  y  .05,  H0  se  rechaza.  Los  resultados  son  estadistica¬ 
mente  significativos. 

•  Si  el  valor  p  esta  entre  .05  y  .10,  H0 por  lo  general  no  se  rechaza.  Los  resultados 
son  solo  tendentes  hacia  significancia  estadistica. 

•  Si  el  valor  p  es  mayor  a  .10,  H0  no  es  rechazada.  Los  resultados  no  son  estadisti¬ 
camente  significativos. 

Los  estandares  establecidos  por  dependencias  del  gobierno  indican  que  los  estadouni- 
denses  no  deben  exceder  una  ingesta  diaria  de  sodio  con  promedio  de  3300  miligramos 
(mg).  Para  averiguar  si  los  estadounidenses  estan  excediendo  este  limite,  se  selecciono 
una  muestra  de  cien  de  ellos  y  se  encontro  que  la  media  y  desviacion  estandar  de  ingesta 
diaria  de  sodio  era  de  3400  mg  y  1 100  mg,  respectivamente.  Use  a  =  .05  para  efectuar 
una  prueba  de  hipotesis. 


+A1  informar  la  significancia  estadistica,  muchos  investigadores  escriben  (p  <  .05)  o  (P  <  .05)  para  indicar  que 
el  valor  p  de  la  prueba  fue  menor  a  .05,  haciendo  los  resultados  importantes  al  nivel  de  5%.  El  simbolo  p  o  P 
de  la  expresion  no  tiene  relacion  con  nuestra  notacion  para  probabilidad  o  con  el  parametro  binomial  p. 


www.FreeLibros.me 


9.3  UNA  PRUEBA  DE  MUESTRA  GRANDE  ACERCA  DE  UNA  MEDIA  POBLACIONAL  O 


353 


Solucion  Las  hipotesis  a  probarse  son 
H0 :  fx  =  3300  contra  //a :  /u,  >  3300 


CONSEJO 


Valor  p  pequeno  <=>  valor  z 
grande. 


Valor  p  pequeno  =>  rechazar 
W0-  z,Que  tan  pequeno?  Valor 
p<  a. 


y  el  estadfstico  de  prueba  es 

^  *  ~  Mo  =  3400  -  3300  =  91 
s/Vn  I  lOO/VlOO 

Los  dos  metodos  desarrollados  en  esta  seccion  dan  las  mismas  conclusiones. 

•  Metodo  del  valor  critico:  Como  el  nivel  de  significancia  es  a  =  .05  y  la  prueba 
es  de  una  cola,  la  region  de  rechazo  esta  determinada  por  un  valor  critico  con 
area  de  cola  igual  a  a  =  .05;  esto  es,  H0  puede  ser  rechazada  si  z  >  1.645.  Como 
z  =  .91  no  es  mayor  que  el  valor  critico,  H0  no  es  rechazada  (vease  la  figura  9.6). 

•  Metodo  del  valor  p:  Calcule  el  valor  p,  la  probabilidad  de  que  z  es  mayor  o  igual 
a  z  =  .91: 


Valor  p  =  P(z  >  .91)  =  1  -  .8186  =  .1814 

La  hipotesis  nula  puede  ser  rechazada  solo  si  el  valor  p  es  menor  o  igual  al  nivel  de 
significancia  especificado  de  5%.  Por  tanto,  H0  no  es  rechazada  y  los  resultados  no  son 
estadisticamente  significativos  (vease  la  figura  9.6).  No  hay  suficiente  evidencia  para 
indicar  que  el  promedio  de  ingesta  diaria  de  sodio  exceda  de  3300  mg. 


FIGURA  9.6 

Region  de  rechazo  y  valor  p 
para  el  ejemplo  9.7 


Rechazar  HQ(z>  1 .645) 


Se  puede  usar  el  applet  Large-Sample  Test  of  a  Population  Mean  (Prueba  de 
muestras  grandes  de  una  media  poblacional)  para  visualizar  los  valores  p  para 
pruebas  de  una  o  de  dos  colas  de  la  media  poblacional  p  (figura  9.7),  pero  recuerde 
que  estas  pruebas  z  estan  restringidas  a  muestras  de  tamano  n  >  30.  El  applet  no  pro- 
hfbe  introducir  un  valor  de  n  <  30,  pero  hay  que  tener  cuidado  de  verificar  el  tamano 
muestral  antes  de  empezar.  El  procedimiento  sigue  el  mismo  modelo  que  con  applets 
previos.  Se  introducen  los  valores  de  x,  n  y  s,  recuerde  presionar  “Enter”  despues  de 
cada  entrada  para  registrar  los  cambios.  El  applet  calculara  z  (usando  precision  com- 
pleta)  y  da  la  opcion  de  escoger  valores  p  de  una  o  de  dos  colas  ( Area  a  la  izquierda, 
Area  a  la  derecha  o  Dos  Colas),  asf  como  area  Central  que  el  usuario  no  necesitara. 
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FIGURA  9.7 

Applet  Large-Sample  Test 
of  a  Population  Mean 


X'bar  mu 
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Para  los  datos  del  ejemplo  9.7,  el  valor  p  es  el  area  de  una  cola  a  la  derecha  de  z  = 
.909.  (;,Los  resultados  mostrados  en  el  applet  confirman  nuestras  conclusiones  del 
ejemplo  9.7?  Recuerde  que  el  applet  usa  precision  completa  para  el  calculo  de  z  y 
su  probabilidad  correspondiente.  Esto  significa  que  la  probabilidad  que  calculamos 
usando  la  tabla  3  del  apendice  I  puede  ser  ligeramente  diferente  respecto  de  la  proba¬ 
bilidad  mostrada  en  el  applet. 


Observe  que  estos  dos  metodos  son  iguales  en  realidad,  como  se  ve  en  la  figura  9.6. 
Tan  pronto  como  el  valor  calculado  del  estadistico  de  prueba  z  se  hace  mayor  que  el 
valor  critico,  z,„  el  valor  p  se  hace  menor  que  el  nivel  de  significance  a.  Se  puede  usar 
el  mas  comodo  de  los  dos  metodos;  las  conclusiones  a  las  que  se  llegue  siempre  seran 
iguales.  El  metodo  del  valor  p  tiene  dos  ventajas: 

•  La  salida  estadfstica  de  paquetes  como  el  MINITAB  por  lo  general  informa  del 
valor  p  de  la  prueba. 

•  Con  base  en  el  valor  p,  los  resultados  de  la  prueba  se  pueden  evaluar  usando 
cualquier  nivel  de  significancia  que  se  desee.  Muchos  investigadores  informan 
del  nivel  de  significancia  mas  pequeno  posible  para  el  cual  los  resultados  son 
estadisticamente  significativos. 

A  veces  es  facil  confundir  el  nivel  de  significancia  a  con  el  valor  p  (o  nivel  de  signi¬ 
ficancia  observado).  Ambos  son  probabilidades  calculadas  como  areas  en  las  colas  de 
la  distribution  muestral  de  la  estadfstica  de  prueba.  No  obstante,  el  nivel  de  significan¬ 
cia  a  es  establecido  previamente  por  el  experimentador  antes  de  recolectar  los  datos.  El 
valor  p  esta  unido  de  manera  directa  a  los  datos  y  en  realidad  describe  que  tan  probables 
o  improbables  son  los  resultados  muestrales,  suponiendo  que  H0  sea  verdadera.  Cuanto 
mas  pequeno  sea  el  valor  p,  mas  improbable  es  que  H0  sea  verdadera. 
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Regiones  de  rechazo,  valores  p  y  conclusiones 

El  nivel  de  significancia,  a,  permite  establecer  el  riesgo  que  estamos  dispuestos  a 
correr  al  tomar  una  decision  incorrecta  en  una  prueba  de  hipotesis. 


•  Para  establecer  la  region  de  rechazo,  escoja  un  valor  critico  de  z  de  modo  que 
el  area  en  la(s)  cola(s)  de  la  distribucion  z  sea  a  para  una  prueba  de  una  cola 

o  a/2  para  una  prueba  de  dos  colas.  Use  la  cola  derecha  para  una  prueba  de 
cola  superior  y  la  cola  izquierda  para  una  prueba  de  cola  inferior.  Rechace  H0 
cuando  el  estadfstico  de  prueba  exceda  del  valor  critico  y  caiga  en  la  region  de 
rechazo. 

•  Para  hallar  un  valor  p,  encuentre  el  area  en  la  cola  “mas  alia”  del  estadfstico 
de  prueba.  Si  la  prueba  es  de  una  cola,  este  es  el  valor  p.  Si  la  prueba  es  de  dos 
colas,  esta  es  solo  la  mitad  del  valor  p  y  debe  duplicarse.  Rechace  //„  cuando 
el  valor  p  sea  menor  a  a. 

Reportorio  de  ejercicios 

A.  Metodo  del  valor  critico:  Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 

El  primer  problema  ya  esta  resuelto. 


Estadistico 
de  prueba 

Nivel  de 
significancia 

iPrueba  de  una  o 
dos  colas? 

Valor  critico 

Region  de 
rechazo 

Conclusion 

z  —  1.4 

a  =  .05 

Una  sola  (superior) 

1.645 

z  >  1.645 

No  rechazar  Ha 

z  =  2.46 

a  =  .01 

Una  sola  (superior) 

z  —  -0.74 

a  =  .05 

Dos  colas 

z  —  -6.12 

a  =  .01 

Dos  colas 

B.  Metodo  del  valor p:  Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 
El  primer  problema  ya  esta  resuelto. 


Estadistico 
de  prueba 

Nivel  de 
significancia 

^Prueba  de  una  o 
dos  colas? 

Valor  p 

iValor  p  <  a? 

Conclusion 

z  —  1.4 

a  =  .05 

Una  cola  (superior) 

No  rechazar  Ha 

z  =  2.46 

a  =  .01 

Una  cola  (superior) 

z  —  -0.74 

a  =  .05 

Dos  colas 

z  —  -6.12 

a  =  .01 

Dos  colas 

Informe  de  progreso 

•  ■  Todavfa  tiene  problemas?  Trate  de  nuevo  usando  el  Repertorio  de  ejercicios 
del  final  de  esta  seccion. 

•  'Ya  domina  los  valores  p  y  regiones  de  rechazo?  Puede  saltarse  el  Repertorio 
de  ejercicios  del  final  de  esta  seccion. 

Las  respuestas  estan  al  final  de  este  libro. 
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Dos  tipos  de  errores 

Uno  podrfa  preguntarse  por  que,  cuando  H0  no  fue  rechazada  en  el  ejemplo  previo,  no 
dijimos  que  H0  era  definitivamente  verdadera  y  /jl  =  3300.  Esto  es  porque,  si  escogemos 
aceptar  H0,  debemos  tener  una  medida  de  la  probabilidad  de  error  asociada  con  esta 
decision. 

Como  hay  dos  opciones  en  una  prueba  estadistica,  tambien  hay  dos  tipos  de  errores 
que  se  pueden  cometer.  En  la  sala  de  juzgado,  el  demandado  podrfa  ser  considerado  no 
culpable  cuando  en  realidad  es  culpable,  o  viceversa;  lo  mismo  es  cierto  en  una  prueba 
estadistica.  De  hecho,  la  hipotesis  nula  puede  ser  verdadera  o  falsa,  cualquiera  que  sea 
la  decision  que  tome  el  experimentador.  Estas  dos  posibilidades,  junto  con  las  dos  deci- 
siones  que  puede  tomar  el  investigador,  se  ven  en  la  tabla  9. 1 . 


tabla  9.1  Tabla  de  decision 

Hipotesis  nula 

Decision  Verdadera  Falsa 

Rechazar  W0  Errortipol  Decision  correcta 

Aceptar  W0  Decision  correcta  Error  tipo  II 


Ademas  del  error  tipo  I  con  probabilidad  a  definida  antes  en  esta  section,  es  posible 
cometer  un  segundo  error,  llamado  error  tipo  II,  que  tiene  probabilidad  (3. 


Definicion  Un  error  tipo  I  para  una  prueba  estadistica  es  el  error  de  rechazar  la 
hipotesis  nula  cuando  sea  verdadera.  La  probabilidad  de  cometer  un  error  tipo  I  se  denota 
por  el  simbolo  a. 

Un  error  tipo  II  para  una  prueba  estadistica  es  el  error  de  aceptar  la  hipotesis  nula 
cuando  es  falsa  y  alguna  hipotesis  alternativa  es  verdadera.  La  probabilidad  de  cometer 
un  error  tipo  II  se  denota  por  el  simbolo  (3. 


a  =  Pfrechazar  W0  cuando  W0 
es  verdadera). 


/3  =  P( aceptar  W0  cuando  W0 
es  falsa). 


Observe  que  la  probabilidad  de  un  error  tipo  I  es  exactamente  igual  que  el  nivel  de 
significancia  a  y,  por  tanto,  es  controlada  por  el  investigador.  Cuando  H0  es  rechazada, 
se  tiene  una  medida  precisa  de  la  confiabilidad  de  la  inferencia;  la  probabilidad  de  una 
decision  incorrecta  es  a,  pero  la  probabilidad  (3  de  un  error  tipo  II  no  siempre  es  contro¬ 
lada  por  el  experimentador.  De  hecho,  cuando  H0  es  falsa  y  //a  es  verdadera,  puede  que 
no  sea  posible  especificar  un  valor  exacto  para  /x,  sino  solo  un  intervalo  de  valores.  Esto 
hace  dificil,  si  no  imposible,  calcular  (3.  Sin  una  medida  de  confiabilidad,  no  es  inteli- 
gente  concluir  que  H0  sea  verdadera.  En  lugar  de  arriesgarse  a  una  decision  incorrecta, 
el  experimentador  debe  detener  el  juicio,  concluyendo  que  no  hay  evidencia  suficiente 
para  rechazar  H„.  En  lugar  de  aceptar  H,h  no  se  debe  rechazar  H0. 

Recuerde  que  “ aceptar ”  una  hipotesis  particular  significa  decidir  en  su  favor.  Cual¬ 
quiera  que  sea  el  resultado  de  una  prueba,  nunca  se  esta  seguro  que  la  hipotesis  que  se 
“acepte”  es  verdadera.  Siempre  hay  un  riesgo  de  estar  equivocado  ( medido  por  a  o  f3). 
En  consecuencia,  nunca  “acepte”  H0  si  (3  es  desconocida  o  su  valor  es  inaceptable  para 
el  experimentador.  Cuando  ocurra  esta  situation,  se  debe  detener  el  juicio  y  recolectar 
mas  information. 


El  poder  de  una  prueba  estadfstica 

La  bondad  de  una  prueba  estadfstica  se  mide  por  el  tamano  de  las  dos  tasas  de  error:  a,  la 
probabilidad  de  rechazar  H0  cuando  es  verdadera,  y  (3,  la  probabilidad  de  rechazar  H0 
cuando  H0  es  falsa  y  Hd  es  verdadera.  Una  “buena”  prueba  es  aquella  para  la  que  estas 
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tasas  de  error  son  pequenas.  El  experimentador  empieza  por  seleccionar  a ,  la  probabili- 
dad  de  un  error  tipo  I.  Si  el  o  ella  decide  controlar  el  valor  de  (3,  la  probabilidad  de  acep- 
tar  H0  cuando  //a  es  verdadera,  entonces  se  selecciona  un  tamano  muestral  apropiado. 

Otra  forma  de  evaluar  una  prueba  es  ver  el  complemento  de  un  error  tipo  II,  es  decir, 
rechazar  H0  cuando  //a  es  verdadero,  lo  cual  tiene  probabilidad 

1  ~  (3  =  P(rechazar  H0  cuando  Hd  es  verdadera) 

La  cantidad  (1  —  (3)  se  denomina  potencia  de  la  prueba  debido  a  que  mide  la  proba¬ 
bilidad  de  tomar  la  accion  que  deseamos  que  ocurra,  esto  es,  rechazar  la  hipotesis  nula 
cuando  es  falsa  y  Hd  es  verdadera. 


Definicion  La  prueba  estadlstica  de  potencia,  dada  como 
\  —  (3  =  PI rechazar  H0  cuando  Hd  es  verdadera) 
mide  la  capacidad  de  la  prueba  para  funcionar  como  se  requiere. 


Una  grafica  de  (1  —  [3).  la  probabilidad  de  rechazar  H0  cuando  en  realidad  H0  es 
falsa,  como  funcion  del  valor  verdadero  del  parametro  de  interes  se  denomina  curva 
de  potencia  para  la  prueba  estadlstica.  En  el  ideal,  nos  gustarfa  que  a  fuera  pequena  y 
la  potencia  (1  —  (3)  fuera  grande. 

ejemplo  9.8  Consulte  el  ejemplo  9.5.  Calcule  /3  y  la  potencia  de  la  prueba  (1  —  (3 )  cuando  i±  sea  en 

realidad  igual  a  870  toneladas  cortas. 

Solucion  La  region  de  aceptacion  para  la  prueba  del  ejemplo  9.5  esta  ubicada  en  el 
intervalo  [/ x0  ±  1.96(s/Vn)].  Sustituyendo  valores  numericos,  resulta 


880  ±1.96^^=j  o  874.18  a  885.82 

La  probabilidad  de  aceptar  H0,  dada  /j.  =  870,  es  igual  al  area  bajo  la  distribucion  mues¬ 
tral  para  la  estadlstica  de  prueba  x  en  el  intervalo  de  874.18  a  885.82.  Como  x  esta 
normalmente  distribuida  con  una  media  de  870  y  SE  =  21/V50  =  2.97,  f3  es  igual  al 
area  bajo  la  curva  normal  con  /j.  =  870  ubicada  entre  874.18  y  885.82  (vease  la  figura 
9.8).  Al  calcular  los  valores  z  correspondientes  a  874.18  y  885.82,  tendremos 


FIGURA  9.8 

Calculo  de  /3  en 
el  ejemplo  9.8 
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_  ^  x  -  ix  =  874.18  -  870  =  , 
s/Vn  21/V50 


__  X  —  /Ji 

s/Vn 

Entonces 


885.82  -  870  =  5  33 
21/V50 


/ 3  =  Pfaceptar  H0  cuando  yu,  =  870)  =  P(874.18  <  x  <  885.82  cuando  yu,  =  870) 

=  P(1.41  <  z<  5.33) 

Se  puede  ver  de  la  figura  9.8  que  el  area  bajo  la  curva  normal  con  yu,  =  870  arriba  de 
x  =  885.82  (o  z  =  5.33)  es  insignificante.  Por  tanto, 

y8  =  P(z>  1.41) 

De  la  tabla  3  del  apendice  I  se  puede  hallar 
yS  =  1  -  .9207  =  .0793 
En  consecuencia,  la  potencia  de  la  prueba  es 
1  -  yS  =  1  -  .0793  =  .9207 

La  probabilidad  de  rechazar  correctamente  H0,  dado  que  yu,  es  en  realidad  igual  a  870, 
es  .9207 ,  o  alrededor  de  92  probabilidades  en  100. 


Se  puede  usar  el  applet  Power  of  a  z-Test  (Potencia  de  una  prueba  z)  para  calcular 
la  potencia  para  la  prueba  hipotetica  del  ejemplo  9.8  y  tambien  para  la  misma  prueba 
cuando  se  cambie  el  tamano  muestral.  Consulte  la  figura  9.9.  El  applet  de  la  figura  9.9 
muestra  un  tamano  muestral  den  =  50.  El  cursor  de  la  parte  inferior  del  applet  permite 
cambiar  el  valor  verdadero  de  yu,;  la  potencia  se  recalcula  cuando  cambia  la  media. 
(:  Cual  es  el  verdadero  valor  de  yu,  y  la  potencia  de  la  prueba  mostrada  en  el  applet? 
Compare  esto  con  el  valor  hallado  en  la  tabla  9.2.  El  cursor  del  lado  izquierdo  del  applet 
permite  cambiar  a  y  el  cursor  de  la  derecha  permite  cambiar  el  tamano  muestral  n. 
Recuerde  que  n  debe  ser  >  30  para  que  la  prueba  z  sea  apropiada.  Se  usaran  estos 
applets  para  explorar  potencia  usando  los  Ejercicios  MiApplet  al  final  del  capftulo. 


FIGURA  9.9 

Applet  Power  of  a  z-Test 
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TABLA  9.2 


FIGURA  9.1  0 

Curva  de  potencia  para  el 
ejemplo  9.8 


Se  pueden  calcular  valores  de  (1  —  (3)  para  diversos  valores  de  j±d  diferentes  a  /m,  = 
880  para  medir  la  potencia  de  la  prueba.  Por  ejemplo,  si  /jLa  =  885, 

(3  =  P(874.18  <  x  <  885.82  cuando  /x  =  885) 

=  PC— 3.64  <  z  <  -28) 

=  .6103  -  0  =  .6103 

y  la  potencia  es  (1  —  /3)  =  .3897.  La  tabla  9.2  muestra  la  potencia  de  la  prueba  para 
diversos  valores  de  y  en  la  figura  9.10  se  grafica  una  curva  de  potencia.  Observe  que 
la  potencia  de  la  prueba  aumenta  cuando  aumenta  la  distancia  entre  /ra  y  p.„.  El  resultado 
es  una  curva  en  forma  de  U  para  esta  prueba  de  dos  colas. 


Valor  de  (1  -  /3)  para  diversos  valores  de  fia  para  el  ejemplo  9.8 


M-a 

(1-/3) 

M-a 

(1-/3) 

865 

.9990 

883 

.1726 

870 

.9207 

885 

.3897 

872 

.7673 

888 

.7673 

875 

.3897 

890 

.9207 

877 

.1726 

895 

.9990 

880 

.0500 

Hay  numerosos  enlaces  importantes  entre  las  dos  tasas  de  error,  a  y  [3.  la  potencia, 
(1  —  yS),  y  el  tamano  muestral,  n.  Vea  las  dos  curvas  que  se  ilustran  en  la  figura  9.8. 

•  Si  a  (la  suma  de  las  dos  areas  de  cola  de  la  curva  de  la  derecha)  aumenta,  el  area 
sombreada  correspondiente  a  (3  disminuye  y  viceversa. 

•  La  unica  forma  de  disminuir  (3  para  una  a  fija  es  “comprar”  mas  informacion,  es 
decir,  aumentar  el  tamano  muestral  n. 

iQue  ocurrirfa  al  area  /3  cuando  la  curva  de  la  izquierda  se  acerca  a  la  curva  de  la  derecha 
(/ u.  =  880)?  Con  la  region  de  rechazo  de  la  curva  derecha  fija,  el  valor  de  (3  aumentara. 
(',Que  efecto  tiene  esto  en  la  potencia  de  la  prueba?  Veamos  la  figura  9.10. 
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Tambien  es  posible  que  el  experimentador  utilice  el  applet  Power  of  a  ’-Test  para 
ayudarse  a  visualizar  las  siguientes  expresiones: 

•  Cuando  aumenta  la  distancia  entre  los  valores  verdadero  (/xa)  e  hipotetico  (yu,0)  de 
la  media,  la  potencia  ( 1  —  /3)  aumenta.  La  prueba  es  mejor  para  detectar  diferen- 
cias  cuando  la  distancia  es  grande. 

•  Cuanto  mas  se  acerque  el  verdadero  valor  (p.J  al  valor  hipotetico  (/x0),  menos 
potencia  tiene  (1  —  /3)  para  detectar  la  diferencia. 

•  La  linica  forma  de  aumentar  la  potencia  (1  —  (3)  para  una  a  fija  es  “comprar” 
mas  informacion,  es  decir,  aumentar  el  tamano  muestral,  n. 

El  experimentador  debe  decidir  sobre  los  valores  de  a  y  /3,  o  sea  medir  los  riesgos  de 
los  posibles  errores  que  el  o  ella  puedan  tolerar.  El  o  ella  deben  decidir  cuanta  potencia 
es  necesaria  para  detectar  diferencias  que  sean  practicamente  importantes  en  el  experi- 
mento.  Una  vez  tomadas  estas  decisiones,  el  tamano  muestral  puede  escogerse  al  con- 
sultar  las  curvas  de  potencia  correspondientes  a  diversos  tamanos  muestrales  para  la 
prueba  escogida. 

(@  ENTRENADOR  PERSONAL 

^Corno  calculo  /8? 

1.  Encuentre  el  valor  o  valores  criticos  de  x  usados  para  separar  las  regiones  de  acep- 
tacion  y  rechazo. 

2.  Usando  uno  o  mas  valores  para  /x  consistentes  con  la  hipotesis  alternativa  //a, 
calcule  la  probabilidad  de  que  la  media  muestral  x  caiga  en  la  region  de  acepta- 
cion.  Esto  produce  el  valor  [3  =  P(aceptar  //a  cuando  p.  =  /xa). 

3.  Recuerde  que  la  potencia  de  la  prueba  es  (1  —  /3). 


0 


EJERCICIOS 


REPERTORIO  DE  EJERCICIOS 


Estos  ejercicios  se  ref i ere n  a  la  seccion  Mi  entrenador  personal  de  la  pagina  355. 

9.1  Metodo  del  valor  critico  Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 


Estadistico 
de  prueba 

Nivel  de 
significancia 

^Prueba  de  una 
o  dos  colas? 

Valor  critico 

Region  de 
rechazo 

Conclusion 

z  =  0.88 

a  =  .05 

Dos  colas 

z  —  -2.67 

a  =  .05 

Una  cola  (inferior) 

z  =  5.05 

a  =  .01 

Dos  colas 

z  —  -1.22 

a=  .01 

Una  cola  (inferior) 

9.2  Vletodo  del  valor  p  Llene  los  espacios  en  bianco  en  la  tabla  siguiente. 


Estadistico 
de  prueba 

Nivel  de 
significancia 

^Prueba  de  una 
o  dos  colas? 

Valor  p 

iValor  p<  a ? 

Conclusion 

z  =  3.01 

a  =  .05 

Dos  colas 

z  =  2.47 

a  =  .05 

Una  cola  (superior) 

z  —  -1.30 

a  =  .01 

Dos  colas 

CO 

CO 

CNi 

1 

II 

N 

a=  .01 

Una  cola  (inferior) 
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TECNICAS  BASICAS 

9.3  Encuentre  las  regiones  de  rechazo  apropiadas  para  la 
estadistica  de  prueba  z  de  muestras  grandes  en  estos  casos: 

a.  Una  prueba  de  cola  derecha  con  a  =  .01 

b.  Una  prueba  de  dos  colas  al  nivel  de  significancia  de  5% 

c.  Una  prueba  de  cola  izquierda  al  nivel  de  significancia 
de  1% 

d.  Una  prueba  de  dos  colas  con  a  =  .01 

9.4  Encuentre  el  valor  p  para  las  siguientes  pruebas  z  de 
muestras  grandes: 

a.  Una  prueba  de  cola  derecha  con  z  observada  =  1.15 

b.  Una  prueba  de  dos  colas  con  z  observada  =  —2.78 

c.  Una  prueba  de  cola  izquierda  con  z  observada 
=  -1.81 

9.5  Para  las  tres  pruebas  dadas  en  el  ejercicio  9.4,  use  el 
valor  p  para  determinar  la  significancia  de  los  resultados. 
Explique  lo  que  significa  “estadfsticamente  significativo” 
en  terminos  de  rechazar  o  aceptar  H0  y  //a. 

9.6  Una  muestra  aleatoria  de  n  =  35  observaciones  de 
una  poblacion  cuantitativa  produjo  una  media  de  x  = 

2.4  y  una  desviacion  estandar  s  =  .29.  Suponga  que  el 
objetivo  de  su  investigation  es  demostrar  que  la  media 
poblacional  p  excede  de  2.3. 

a.  De  la  hipotesis  nula  y  alternativa  para  la  prueba. 

b.  Localice  la  region  de  rechazo  para  la  prueba  usando 
un  nivel  de  significancia  de  5%. 

c.  Encuentre  el  error  estandar  de  la  media. 

d.  Antes  de  realizar  la  prueba,  use  su  intuition  para 
decidir  si  es  probable  o  improbable  la  media  muestral 
x  =  2.4,  suponiendo  que  p  =  2.3.  Ahora  realice  la 
prueba.  ^Los  datos  dan  suficiente  evidencia  para 
indicar  que  p  >  2.3? 

9.7  Consulte  el  ejercicio  9.6. 

a.  Calcule  el  valor  p  para  la  estadistica  de  prueba  del 
inciso  d). 

b.  Use  el  valor  p  para  sacar  una  conclusion  al  nivel  de 
significancia  de  5%. 

c.  Compare  la  conclusion  del  inciso  b)  con  la  conclusion 
alcanzada  en  el  inciso  d)  del  ejercicio  9.6.  <',Son 
iguales? 

9.8  Consulte  el  ejercicio  9.6.  Usted  desea  probar  H0  :  p 
=  2.3  contra  Hn:  p  >  2.3. 

a.  Encuentre  el  valor  crftico  de  x  usado  para  rechazar  H0. 

b.  Calcule  (3  =  Pf aceptar  H0  cuando  p  =  2.4). 

c.  Repita  el  calculo  de  (3  para  p  =  2.3,  2.5  y  2.6. 

d.  Use  los  valores  de  (3  de  los  incisos  b)  y  c)  para 
graficar  la  curva  de  potencia  para  la  prueba. 


9.9  Una  muestra  aleatoria  de  100  observaciones 
de  una  poblacion  cuantitativa  produjo  una  media 
muestral  de  26.8  y  una  desviacion  muestral  estandar 
de  6.5.  Use  el  metodo  del  valor  p  para  determinar  si 
la  media  poblacional  es  diferente  de  28.  Explique  sus 
conclusiones. 

APLICACIONES 

9.10  Porcentajes  de  ocupacion  en  lineas 
aereas  Los  altos  porcentajes  de  ocupacion  en 
vuelos  regulares  son  esenciales  para  la  rentabilidad 
corporativa.  Suponga  que  un  vuelo  regular  debe 
promediar  al  menos  60%  de  ocupacion  para  ser 
rentable  y  un  examen  del  porcentaje  de  ocupacion 
para  120  vuelos  de  las  10:00  a.m.  de  Atlanta  a  Dallas 
mostro  una  ocupacion  media  por  vuelo  de  58%  y  una 
desviacion  estandar  de  11%. 

a.  Si  p  es  la  ocupacion  media  por  vuelo  y  si  la 
compania  decide  determinar  si  este  vuelo  es  rentable 
o  no  lo  es,  de  la  hipotesis  alternativa  y  nula  para  la 
prueba. 

b.  (',La  hipotesis  alternativa  del  inciso  a)  implica  una 
prueba  de  una  o  de  dos  colas?  Explique. 

c.  (',Los  datos  de  ocupacion  para  los  1 20  vuelos  sugieren 
que  este  vuelo  regular  no  es  rentable?  Pruebe  usando 
cr  =  .05. 

9.1 1  Carne  para  hamburguesa  El  ejercicio  8.33  se 
refiere  al  departamento  de  carnes  de  una  cadena  local  de 
supermercados  que  empaca  carne  molida  en  charolas 

de  dos  tamanos.  La  charola  mas  pequena  esta  disenada 
para  contener  1  libra  de  carne.  Una  muestra  aleatoria  de 
35  paquetes  de  la  charola  mas  pequena  de  carne  produjo 
mediciones  de  peso  con  un  promedio  de  1.01  libras  y  una 
desviacion  estandar  de  .18  libras. 

a.  Si  usted  fuera  el  gerente  de  control  de  calidad  y 
deseara  asegurarse  que  la  cantidad  promedio  de  carne 
molida  era  en  realidad  de  1  libra,  ^cuales  hipotesis 
probarfa? 

b.  Encuentre  el  valor  p  para  la  prueba  y  liselo  para 
efectuar  la  prueba  del  inciso  a). 

c.  (',De  que  modo  usted,  como  gerente  de  control  de 
calidad,  informa  los  resultados  de  su  estudio  a  un 
grupo  de  interes  del  consumidor? 

9.12  Especies  invasoras  En  un  estudio  de  la 
perniciosa  manzanilla  cimarrona  gigante,  una  de  las 
especies  herbaceas  mas  altas  en  Europa,  Jan  Pergl1 

y  asociados  compararon  la  densidad  de  estas  plantas 
en  lugares  controlados  y  no  controlados  de  la  region 
del  Caucaso  en  Rusia.  En  su  zona  nativa,  la  densidad 
promedio  se  encontro  que  era  de  cinco  plantas  por  metro 
cuadrado.  En  la  zona  invadida  en  la  Republica  Checa, 
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una  muestra  de  n  =  50  plantas  produjo  una  densidad 
pro  medio  de  1 1.17  plantas  por  metro  cuadrado  con  una 
desviacion  estandar  de  3.9  plantas  por  metro  cuadrado. 

a.  i  La  zona  invadida  en  la  reptiblica  checa  tiene  una 
densidad  promedio  de  manzanilla  cimarrona  gigante 
que  es  diferente  de  p,  =  5  al  nivel  de  significancia 

a  =  -.05? 

b.  ('Cual  es  el  valor  p  asociado  con  la  prueba  del  inciso 
a)?  (.Puede  usted  rechazar  H0  al  nivel  de  significancia 
de  5%  usando  el  valor  pi 

9.13  Potencia  de  un  antibiotico  Un  fabricante  de 
medicamentos  dijo  que  la  potencia  media  de  uno  de  sus 
antibioticos  fue  80%.  Se  probo  una  muestra  aleatoria  de 
n  =  100  capsulas  y  produjo  una  media  muestral  de  x  = 
79.7%  con  una  desviacion  estandar  de  s  =  .8%.  ^Los 
datos  presentan  suficiencia  evidencia  para  refutar  lo  dicho 
por  el  fabricante?  Sea  a  =  .05. 

a.  Exprese  la  hipotesis  nula  a  ser  probada. 

b.  Exprese  la  hipotesis  alternativa. 

c.  Realiza  una  prueba  estadfstica  de  la  hipotesis  nula  y 
exprese  su  conclusion. 

9.14  Horario  flexible  Numerosas  companfas 
tienen  ahora  un  horario  flexible,  en  el  que  un  trabajador 
programa  sus  propias  horas  de  trabajo  o  “comprime”  el 
tiempo  de  semanas  de  trabajo.  Una  companla  que  estaba 
contemplando  la  instalacion  de  un  programa  de  horario 
flexible  estimo  que  necesitaba  una  media  minima  de  7 
horas  por  dla  por  trabajador  de  ensamble  para  operar  de 
manera  eficiente.  A  cada  uno  de  una  muestra  aleatoria 
de  80  ensambladores  de  la  companfa  se  les  pidio  que 
enviaran  un  programa  de  horario  flexible.  Si  el  numero 
medio  de  horas  por  dfa  para  el  lunes  era  de  6.7  horas  y 
la  desviacion  estandar  fue  de  2.7  horas,  ^los  datos  dan 
suhciente  evidencia  para  indicar  que  el  numero  medio 
de  horas  trabajadas  por  dla  los  lunes,  para  todos  los 
ensambladores  de  la  companla,  sera  menor  a  7  horas? 
Pruebe  usando  a  =  .05. 

9.15  ^La  educacion  universitaria  da 

resultados?  Un  artlculo  del  Time  que  describe  varios 
aspectos  de  la  vida  de  los  estadounidenses  indico  que  la 
educacion  superior  da  resultados  positivos.  Los 
egresados  de  universidad  trabajan  7.4  horas  por  dla, 
menos  que  quienes  no  tienen  educacion  universitaria.2 
Suponga  que  el  dla  habil  promedio,  para  una  muestra 
aleatoria  de  n  =  100  personas  que  tenlan  menos  de  cuatro 
anos  de  educacion  universitaria,  se  calculo  de  x  =  7.9 
horas  con  una  desviacion  estandar  de  s  =  1.9  horas. 

a.  Use  el  metodo  del  valor  p  para  probar  la  hipotesis 
de  que  el  numero  promedio  de  horas  trabajadas, 


por  personas  que  no  tienen  tltulo  universitario,  es 
mayor  que  los  que  si  lo  tienen.  <,  A  que  nivel  se  puede 
rechazar  H01 

b.  Si  usted  fuera  egresado  de  universidad,  /como 
expresarla  su  conclusion  para  estar  en  la  mejor 
posicion? 

c.  Si  no  fuera  egresado  de  universidad,  ^como  expresarla 
su  conclusion? 

9.16  ^.Que  es  normal?  ^Que  es  normal,  cuando 
se  trata  de  temperaturas  corporales  de  personas?  Una 
muestra  aleatoria  de  130  temperaturas  corporales  en 
personas,  dada  por  Allen  Shoemaker3  en  la  Journal  of 
Statistical  Education,  tuvo  una  media  de  98.25  grados 
y  una  desviacion  estandar  de  0.73  grados.  (\Los  datos 
indican  que  el  promedio  de  temperatura  corporal  para 
personas  sanas  es  diferente  de  98.6  grados,  que  es  el 
promedio  de  temperatura  citada  por  medicos  y  otros 
especialistas?  Pruebe  usando  los  dos  metodos  dados  en 
esta  seccion. 

a.  Use  el  metodo  del  valor  p  con  a  =  .05. 

b.  Use  el  metodo  del  valor  crltico  con  a  =  .05. 

c.  Compare  las  conclusiones  de  los  incisos  a)  y  b). 

<^Son  iguales? 

d.  El  estandar  de  98.6  fue  deducido  por  un  medico 
aleman  en  1868,  quien  dijo  haber  registrado  un  millon 
de  temperaturas  en  el  curso  de  su  investigacion.4 
(,Que  conclusiones  se  pueden  sacar  acerca  de  la 
investigacion  de  este  ultimo,  teniendo  en  cuenta  las 
conclusiones  del  mismo  en  los  incisos  a)  y  b)? 

9.17  Deportes  y  lesiones  en  el  tendon  de 
Aquiles  Algunos  deportes  en  los  que  hay  que  correr 
distancias  considerables,  saltar  con  o  sin  garrocha, 
ponen  a  los  participantes  en  riesgo  de  tendinopatia  de 
Aquiles  (AT),  que  es  una  inflamacion  y  engrosamiento 
del  tendon  de  Aquiles.  Un  estudio  de  The  American 
Journal  of  Sports  Medicine  vio  el  diametro  (en  mm)  de 
los  tendones  afectados  para  pacientes  que  participaron 
en  estos  tipos  de  actividades  deportivas.5  Suponga  que 
los  diametros  del  tendon  de  Aquiles  en  la  poblacion 
en  general  tienen  una  media  de  5.97  milfmetros  (mm). 
Cuando  los  diametros  del  tendon  afectado  se  midieron 
para  una  muestra  aleatoria  de  3 1  pacientes,  el  diametro 
promedio  fue  de  9.80  con  una  desviacion  estandar  de 
1.95  mm.  ^Hay  suhciente  evidencia  para  indicar  que 

el  diametro  promedio  del  tendon  para  pacientes  con 
AT  es  mayor  a  5.97  mm?  Pruebe  al  nivel  de  5%  de 
significancia. 
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UNA  PRUEBA  DE  HIPOTESIS  DE  MUESTRAS 
GRANDES  PARA  LA  DIFERENCIA  ENTRE 
DOS  MEDIAS  POBLACIONALES 


En  numerosas  situaciones,  la  pregunta  estadistica  a  ser  contestada  involucre  una  com- 
paracion  de  dos  medias  poblacionales.  Por  ejemplo,  el  U.S.  Postal  Service  esta  inte- 
resado  en  reducir  su  enorme  gasto  de  350  millones  de  galones  de  gasolina  al  ano  al 
cambiar  sus  camiones  de  motor  de  gasolina  por  camiones  electricos.  Para  determinar 
si  se  obtienen  ahorros  importantes  en  costos  de  operacion  al  cambiar  a  camiones  elec¬ 
tricos,  debe  efectuarse  un  estudio  piloto  usando,  por  ejemplo,  cien  camiones  conven- 
cionales  del  correo  con  motor  de  gasolina  y  cien  camiones  electricos  operados  bajo 
condiciones  similares. 

El  estadfstico  que  resume  la  information  muestral  respecto  a  la  diferencia  en  medias 
poblacionales  (/u,i  —  p2)  es  la  diferencia  en  medias  muestrales  (xt  —  x2).  Por  tanto,  al 
probar  si  la  diferencia  en  medias  muestrales  indica  que  la  diferencia  verdadera  en  medias 
poblacionales  difiere  de  un  valor  especificado,  (p  —  p2 )  =  D0,  se  puede  usar  el  error 
estandar  de  (3ci  —  x2). 


estimada  por 


en  la  forma  de  un  estadfstico  z  para  medir  a  cuantas  desviaciones  estandar  se  encuentra 
la  diferencia  (x2  —  x2)  desde  la  diferencia  hipotetica  D0.  A  continuation  se  describe  el 
procedimiento  formal  de  prueba. 


PRUEBA  ESTADISTICA  DE  MUESTRAS  GRANDES 
PARA  (pn  -  p2) 

1 .  Hipotesis  nula:  H0 :  (p  —  p2)  =  D0,  donde  D„  es  alguna  diferencia  especificada 
que  se  desea  probar.  Para  muchas  pruebas,  el  experimentador  hara  hipotesis 

de  que  no  hay  diferencia  entre  yu.,  y  j±2,  esto  es,  D0  =  0. 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

(jxi  —  /x2)  >  D0  :  ( /Xj  —  ^i2)  ^  D0 

[o  Hd :  (  fii  -  /x2)  <  D0] 


3.  Estadfstico  de  prueba:  z  « 


(Xj  -  x2)  -  D0 

SE 


Oi  -  x2)  -  D0 


J 


4.  Region  de  rechazo:  rechazar  H0  cuando 

Prueba  de  una  cola 


Prueba  de  dos  colas 


z>  za 

[o  z  <  —  za  cuando  la  hipotesis 
alternativa  es  H a :  ip.  —  \±2)  <  D0\ 


z>  Zaii  o  bien  z  <  ~zan 


o  cuando  el  valor  p  <  a 
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0 


Zall  0  ZaJ2 


Suposiciones:  Las  muestras  son  seleccionadas  al  azar  y  de  manera  independiente 
de  las  dos  poblaciones  nx  >  30  y  n2  —  30. 


Para  determinar  si  la  propiedad  de  un  auto  afecta  el  rendimiento  academico  de  un  estu- 
diante,  se  tomaron  dos  muestras  aleatorias  de  100  estudiantes  de  sexo  masculino.  El 
promedio  de  calificaciones  para  los  n,  =  100  que  no  eran  duenos  de  autos  tuvieron  un 
promedio  y  variancia  igual  a  Xi  =  2.70  y  s\  =  .36,  en  tanto  que  x2  =  2.54  y  s\  =  .40  para 
los  n2  =  100  propietarios  de  autos.  ^Los  datos  presentan  suficiente  evidencia  para  indi¬ 
car  una  diferencia  en  el  rendimiento  medio  entre  propietarios  de  autos  y  no  propietarios? 
Pruebe  usando  a  =  .05. 


Solucion  Para  detectar  una  diferencia,  si  existe,  entre  los  rendimientos  academicos 
medios  para  no  propietarios  de  autos  y  los  propietarios  probaremos  la  hipotesis 
nula  de  que  no  hay  diferencia  entre  las  medias  contra  la  hipotesis  alternativa  de  que 
(yu-i  —  yu2)  #  0;  esto  es. 


H0 :  (yu,  -  yu,2)  =  D0  =  0  contra  Da :  (yuj  -  yu,2)  #  0 


Sustituyendo  en  la  formula  para  el  estadfstico  de  prueba,  obtenemos 


Cri  “  x2)  -  D0 


2.70  -  2.54 
I  36  |  .40 
V  100  +  100 


1.84 


| Estadtstico  de  prueba|  > 

| Valor  crftico|  <=>  rechazar  Ha. 


El  metodo  del  valor  critico:  Usando  una  prueba  de  dos  colas  con  nivel  de 
significancia  a  =  .05,  se  pone  a/2  =  .025  en  cada  cola  de  la  distribucion  z  y  se 
rechaza  H0  si  z  >  1.96  o  z  <  — 1.96.  Como  z  =  1.84  no  excede  de  1.96  y  no  es 
menor  a  —  1 .96 ,  H0  no  puede  ser  rechazada  (vease  la  figura  9.11).  Esto  es,  hay 
evidencia  insuficiente  para  declarar  una  diferencia  en  el  promedio  de  los  rendi¬ 
mientos  academicos  para  los  dos  grupos.  Recuerde  que  no  debe  estar  dispuesto  a 
aceptar  H0,  es  decir,  declarar  que  las  dos  medias  son  iguales,  sino  hasta  que  (3  sea 
evaluada  para  algunos  valores  significativos  de  ip.|  —  yu2). 


FIGURA  9.1  1 

Region  de  rechazo  y  valor  p 
para  el  ejemplo  9.9 
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•  El  metodo  del  valor  p:  Calcule  el  valor  p,  la  probabilidad  de  que  z  es  mayor  a 
z  =  1-84  mas  la  probabilidad  de  que  z  sea  menor  a  z  =  ~  1.84,  como  se  muestra 
en  la  figura  9.1 1: 

Valor  p  =  P(z  >  1.84)  +  P(z  <  -1.84)  =  (1  -  .9671)  +  .0329  =  .0658 

El  valor  p  se  encuentra  entre  .10  y  .05,  de  modo  que  se  puede  rechazar  H0  al  nivel  .10 
pero  no  al  nivel  de  significancia  .05.  Como  el  valor  p  de  .0658  excede  del  nivel  de  signi- 
ficancia  especificado  a  =  .05,  H0  no  puede  ser  rechazada.  De  nuevo,  el  experimentador 
no  deberfa  estar  dispuesto  a  aceptar  H0  sino  hasta  que  /3  sea  evaluada  para  algunos  valo- 
res  significativos  de  (pt  —  p^). 


Prueba  de  hipotesis  e  intervalos  de  confianza 

Si  usamos  el  metodo  del  valor  crftico  o  del  valor  p  para  probar  hipotesis  acerca  de 
ip.  —  pL2),  siempre  llegaremos  a  la  misma  conclusion  porque  el  valor  calculado  del  esta- 
dlstico  de  prueba  y  el  valor  crftico  estan  relacionados  exactamente  en  la  misma  forma 
que  estan  relacionados  el  valor  p  y  el  nivel  de  significancia  a.  Hay  que  recordar  que  los 
intervalos  de  confianza  construidos  en  el  capltulo  8  podrfan  tambien  usarse  para  con- 
testar  preguntas  acerca  de  la  diferencia  entre  dos  medias  poblacionales.  De  hecho,  para 
una  prueba  de  dos  colas,  el  intervalo  de  confianza  (1  —  a)  100%  para  el  parametro  de 
interes  se  puede  usar  para  probar  su  valor,  igual  que  como  hicimos  de  manera  informal 
en  el  capltulo  8.  El  valor  de  a  indicado  por  el  coeficiente  de  confianza  en  el  intervalo 
de  confianza  es  equivalente  al  nivel  de  significancia  a  en  la  prueba  estadlstica.  Para  una 
prueba  de  una  cola,  el  metodo  equivalente  del  intervalo  de  confianza  usarfa  los  llmites 
de  confianza  de  una  cola  de  la  seccion  8.8  con  coeficiente  de  confianza  a.  Ademas,  con 
el  metodo  del  intervalo  de  confianza,  se  gana  un  margen  de  posibles  valores  para  el  para¬ 
metro  de  interes,  cualquiera  que  sea  el  resultado  de  la  prueba  de  hipotesis. 

•  Si  el  intervalo  de  confianza  que  se  construye  contiene  el  valor  del  parametro  es¬ 
pecificado  por  H0,  entonces  ese  valor  es  uno  de  los  posibles  valores  del  parametro 
y  H0  no  debe  ser  rechazada. 

•  Si  el  valor  hipotetico  se  encuentra  fuera  de  los  llmites  de  confianza,  la  hipotesis 
nula  es  rechazada  al  nivel  de  significancia  a. 

Construya  un  intervalo  de  confianza  de  95%  para  la  diferencia  en  el  promedio  de  rendi- 
miento  academico  entre  propietarios  y  no  propietarios  de  autos.  Usando  el  intervalo  de 
confianza,  £se  puede  concluir  que  hay  una  diferencia  en  las  medias  poblacionales  para 
los  dos  grupos  de  estudiantes? 

Solucion  Para  el  estadlstico  de  muestras  grandes  estudiado  en  el  capltulo  8,  el  inter¬ 
valo  de  confianza  de  95%  se  da  como 

Estimador  puntual  ±  1 .96  X  (Error  estandar  del  estimador) 

Para  la  diferencia  en  dos  medias  poblacionales,  el  intervalo  de  confianza  se  aproxima 
como 


(x,  -  x2)  ±  1.96 


.16  ±  .17 
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o  sea  —.01  <  (yu-i  —  /jl2)  <  .33.  Este  intervalo  da  un  margen  de  posibles  valores  para  la 
diferencia  en  las  medias  poblacionales.  Como  la  diferencia  hipotetica,  (p.,  —  /x2)  =  0, 
esta  contenida  en  el  intervalo  de  confianza,  no  se  deberfa  rechazar  H0.  Vea  los  signos 
de  los  posibles  valores  del  intervalo  de  confianza.  No  se  puede  decir  por  el  intervalo  si 
la  diferencia  en  las  medias  es  negativa  (— ),  positiva  (  +  )  o  cero  (0),  donde  este  ultimo 
indicarfa  que  las  dos  medias  son  iguales.  En  consecuencia,  realmente  no  se  puede  llegar 
a  una  conclusion  en  terminos  de  la  pregunta  planteada.  No  hay  suficiente  evidencia  para 
indicar  que  haya  diferencia  en  el  promedio  de  rendimientos  para  propietarios  y  no  pro- 
pietarios  de  autos.  La  conclusion  es  igual  a  la  que  se  llego  en  el  ejemplo  9.9. 


EJERCICIOS 


TECNICAS  BASICAS 

9.18  Muestras  aleatorias  independientes  de  80 
mediciones  se  tomaron  de  dos  poblaciones  cuantitativas, 
1  y  2.  A  continuacion  veamos  un  resumen  de  los  datos 
muestrales: 


Muestra  1 

Muestra  2 

Tamano  muestral 

80 

80 

Media  muestral 

11.6 

9.7 

Varianza  muestral 

27.9 

38.4 

a.  Si  el  objetivo  de  la  investigation  es  demostrar  que  /x 
es  mayor  que  p.2,  exprese  hipotesis  nula  y  alternativa 
que  escogerfa  para  una  prueba  estadlstica. 

b.  i  La  prueba  del  inciso  a)  es  de  una  o  de  dos  colas? 

c.  Calcule  el  estadlstico  de  prueba  que  usarfa  para  la 
prueba  del  inciso  a).  Con  base  en  su  conocimiento 
de  la  distribution  normal  estandar,  (-,es  esta  una 
observacion  probable  o  no  probable,  suponiendo  que 
H0  es  verdadera  y  las  dos  medias  poblacionales  son 
iguales? 

d.  Metodo  del  valor  p:  encuentre  el  valor  p  para  la 
prueba.  Pruebe  una  diferencia  significativa  en  las 
medias  poblacionales  al  nivel  de  significancia  de  1%. 

e.  Metodo  del  valor  critico:  encuentre  la  region  de 
rechazo  cuando  a  =  .01.  ^Los  datos  dan  suficiente 
evidencia  para  indicar  una  diferencia  en  las  medias 
poblacionales? 

9.19  Muestras  aleatorias  independientes  de  36  y  45 
observaciones  se  sacan  de  dos  poblaciones  cuantitativas, 
1  y  2,  respectivamente.  A  continuacion  se  muestra  el 
resumen  de  datos  muestrales: 

Muestra  1  Muestra  2 

Tamano  muestral  36  45 

Media  muestral  1.24  1.31 

Varianza  muestral  .0560  .0540 


(',Los  datos  presentan  suficiente  evidencia  para  indicar 
que  la  media  para  la  poblacion  1  es  menor  que  la  media 
para  la  poblacion  2?  Use  uno  de  los  dos  metodos  de 
prueba  presentados  en  esta  section  y  explique  sus 
conclusiones. 

9.20  Suponga  que  deseamos  detectar  una  diferencia 
entre  p-i  y  /x2  (ya  sea  >  /x2  o  /xt  <  M 2)  y,  en  lugar 
de  correr  una  prueba  de  dos  colas  usando  a  =  .05,  se 
usa  el  siguiente  procedimiento  de  prueba.  Se  espera 
hasta  haber  recolectado  los  datos  muestrales  y  haber 
calculado  Xi  y  x2.  Si  x,  es  mayor  que  x2,  se  escoge  la 
hipotesis  alternativa  Ha :  >  pu2y  corre  una  prueba 

de  una  cola  poniendo  a,  =  .05  en  la  cola  superior  de  la 
distribucion  z.  Si,  por  el  contrario,  x2  es  mayor  que  xu  se 
invierte  el  procedimiento  y  corre  una  prueba  de  una  cola, 
poniendo  a2  =  .05  en  la  cola  inferior  de  la  distribucion 
z.  Si  usted  usa  este  procedimiento  y  si  /x  1  en  realidad  es 
igual  a  /x2,  ^cual  es  la  probabilidad  a  de  que  concluya 
que  /X!  en  realidad  no  sea  igual  a  /x2  (es  decir,  cual  es 
la  probabilidad  a  de  que  incorrectamente  se  rechace  H0 
cuando  H0  es  verdadera)?  Este  ejercicio  demuestra  por 
que  pruebas  estadlsticas  deben  ser  formuladas  antes  de 
observar  los  datos. 


APLICACIONES 

9.21  ^Cura  para  el  resfriado  comun?  Se  planed 
un  experimento  para  comparer  el  tiempo  medio  (en 
dlas),  necesario  para  recuperarse  de  un  resfriado  comun, 
en  personas  a  las  que  a  diario  se  les  dio  una  dosis  de  4 
miligramos  (mg)  de  vitamina  C  contra  otras  a  las  que 
no  se  dio  un  suplemento  vitamlnico.  Suponga  que  35 
adultos  fueron  seleccionados  al  azar  para  cada  categorfa 
del  tratamiento  y  que  los  tiempos  medios  de  recuperacion 
y  desviaciones  estandar  para  los  dos  grupos  fueron  como 
sigue: 
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Sin  suplemento  4mgde 

vitaminico  vitamina  C 

Tamano  muestral  35  35 

Media  muestral  6.9  5.8 

Desviacion  muestral  estandar  2.9  1.2 

a.  Suponga  que  el  objetivo  de  su  investigation  es 
demostrar  que  el  uso  de  vitamina  C  reduce  el  tiempo 
medio  necesario  para  recuperarse  de  un  resfriado  comiin 
y  sus  complicaciones.  De  las  hipotesis  nula  y  altemativa 
para  la  prueba.  /.Esta  prueba  es  de  una  o  de  dos  colas? 

b.  Realice  la  pmeba  estadistica  de  la  hipotesis  nula  del  inciso 
a)  y  exprese  su  conclusion.  Pruebe  usando  a  =  .05. 

9.22  Alimentation  sana  Los  estadounidenses  son 
ahora  mas  conscientes  de  la  importancia  de  una  buena 
nutricion  y  algunos  investigadores  creen  que  podemos 
estar  alterando  nuestras  dietas  para  incluir  menos  carne 
roja  y  mas  frutas  y  verduras.  Para  probar  la  teorfa  de  que 
el  consumo  de  came  roja  ha  disminuido  en  los  ultimos 
10  anos,  un  investigador  decide  seleccionar  los  registros 
de  nutricion  de  hospital  para  400  personas  encuestadas 
hace  10  anos,  comparando  su  cantidad  promedio  de 
carne  consumida  anualmente  con  respecto  a  cantidades 
consumidas  por  igual  numero  de  personas  entrevistadas 
este  ano.  Los  datos  se  dan  en  la  tabla. 

Hace  10  anos  Este  ano 

Media  muestral  73  63 

Desviacion  muestral  estandar  25  28 

a.  /.Estos  datos  presentan  suficiente  evidencia  para 
indicar  que  el  consumo  de  carne  roja  per  capita  ha 
disminuido  en  los  ultimos  10  anos?  Pruebe  al  nivel  de 
significancia  del  1%. 

b.  Encuentre  un  lirnite  inferior  de  confianza  de  99% 
para  la  diferencia  en  el  promedio  de  consumos  de 
carne  per  capita  para  los  dos  grupos.  (Este  calculo 
se  hizo  como  parte  del  ejercicio  8.76.)  /.El  lirnite  de 
confianza  confirma  sus  conclusiones  del  inciso  a)? 
Explique.  /.Que  informacion  adicional  le  da  el  llmite 
de  confianza? 

9.23  Niveles  de  plomo  en  agua  potable  Analisis 
realizados  en  muestras  de  agua  potable  para  100  casas, 
en  cada  una  de  dos  diferentes  secciones  de  una  ciudad, 
dieron  las  siguientes  medias  y  desviaciones  estandar  de 
niveles  de  plomo  (en  partes  por  millon): 

Seccion  1  Seccion  2 

Tamano  muestral  100  100 

Media  34.1  36.0 

Desviacion  estandar  5.9  6.0 

a.  Calcule  el  estadlstico  de  prueba  y  su  valor  p  (nivel  de 
significancia  observado)  para  probar  una  diferencia 
en  las  dos  medias  poblacionales.  Use  el  valor  p  para 


evaluar  la  significancia  estadistica  de  los  resultados  al 
nivel  de  5%. 

b.  Use  un  intervalo  de  confianza  de  95%  para  estimar  la 
diferencia  en  los  niveles  medios  de  plomo  para  las  dos 
secciones  de  la  ciudad. 

c.  Suponga  que  ingenieros  ambientales  del  municipio 
se  preocuparan  solo  si  detectan  una  diferencia  de 
mas  de  5  partes  por  millon  en  las  dos  secciones  de  la 
ciudad.  Con  base  en  su  intervalo  de  confianza  en  el 
inciso  b),  /,1a  significancia  estadistica  del  inciso  a) 
es  de  importancia  prdctica  para  los  ingenieros  del 
municipio?  Explique. 

9.24  Salarios  iniciales,  otra  vez  En  un  intento 
por  comparar  los  salarios  iniciales  para  estudiantes 
universitarios  que  tienen  especialidad  en  ingenierla 
qulmica  y  ciencias  computacionales  (vease  el  ejercicio 
8.45),  se  seleccionaron  muestras  aleatorias  de  50  recien 
graduados  universitarios  en  cada  especialidad  y  se  obtuvo 
la  siguiente  informacion. 

Especialidad  Media  Desv.  Est. 

Ingenierla  qulmica  $53659  2225 

Ciencias  computacionales  51  042  2375 

a.  /.Los  datos  dan  suficiente  evidencia  para  indicar 
una  diferencia  en  salarios  iniciales  promedio  para 
graduados  universitarios  con  especialidad  en 
ingenierla  qulmica  y  ciencias  computacionales? 

Pruebe  usando  a  =  .05. 

b.  Compare  sus  conclusiones  del  inciso  a)  con  los 
resultados  del  inciso  b)  del  ejercicio  8.45.  /.Son 
iguales?  Explique. 

9.25  Costos  de  hotel  En  el  ejercicio  8.18, 
exploramos  el  costo  promedio  de  alojamiento  en  tres 
cadenas  hoteleras  diferentes.6  Al  azar  seleccionamos  50 
estados  de  cuenta  de  las  bases  de  datos  de  las  cadenas 
hoteleras  Marriott,  Radisson  y  Wyndham,  y  registramos 
las  tarifas  de  un  cuarto  por  noche.  Una  parte  de  los  datos 
muestrales  se  ven  en  la  tabla. 

Marriott  Radisson 

Promedio  muestral  $170  $145 

Desviacion  estandar  muestral  17.5  10 

a.  Antes  de  ver  los  datos,  /.tiene  usted  una  idea 
preconcebida  de  la  direction  de  la  diferencia  entre  las 
tarifas  promedio  por  cuarto  para  estos  dos  hoteles?  Si  no 
es  asl,  /.que  hipotesis  nula  y  alternativa  deben  probarse? 

b.  Use  el  metodo  del  valor  critico  para  determinar  si 
hay  una  diferencia  importante  en  el  promedio  de 
tarifas  por  cuarto  para  las  cadenas  hoteleras  Marriott  y 
Radisson.  Use  a  =  .01. 

c.  Encuentre  el  valor  p  para  esta  prueba.  /.Este  valor  p 
confirma  los  resultados  del  inciso  b)? 
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9.26  Costos  de  hotel  II  Consulte  el  ejercicio 
9.25.  La  tabla  siguiente  muestra  los  datos  muestrales 
recolectados  para  comparar  las  tarifas  promedio  por 
cuarto  en  las  cadenas  hoteleras  Wyndham  y  Radisson.6 

Wyndham  Radisson 

Promedio  muestral  $150  $145 

Desviacion  estandar  muestral  16.5  10 

a.  y,  Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  la  tarifa  promedio  por  cuarto  para 

las  cadenas  hoteleras  Wyndham  y  Radisson?  Use 
a  =  .05. 

b.  Construya  un  intervalo  de  confianza  de  95%  para 
la  diferencia  en  las  tarifas  promedio  por  cuarto 
para  las  dos  cadenas. i Este  intervalo  confirma  sus 
conclusiones  del  inciso  a)? 

9.27  MMT  en  gasolina  La  adicion  de  MMT,  un 
compuesto  que  contiene  manganeso  (Mn),  a  la  gasolina 
como  enriquecedor  de  octano  ha  causado  preocupacion 
por  la  exposition  de  personas  al  Mn,  porque  las  elevadas 
ingestas  han  estado  ligadas  a  graves  efectos  en  la  salud. 
En  un  estudio  de  concentraciones  en  el  aire  ambiente  de 
Mn  fino,  Wallace  y  Slonecker  ( Journal  of  the  Air  and 
Waste  Management  Association)  presentaron  la  siguiente 
information  resumida  de  las  cantidades  de  Mn  lino  (en 
nanogramos  por  metro  cubico)  en  casi  todos  los 
parques  nacionales  y  en  la  mayor  parte  de  zonas  urbanas 
en  California.7 

Parques  nacionales  California 

Media  .94  2.8 

Desviacion  estandar  1.2  2.8 

Numero  de  lugares  36  26 

a.  qHay  suficiente  evidencia  para  indicar  que  las 
concentraciones  medias  difieren  para  los  dos  tipos  de 
lugares  al  nivel  de  significancia  a  =  .05?  Use  la  prueba 
z  de  muestra  grande.  (Cual  es  el  valor  p  de  esta  prueba? 

b.  Construya  un  intervalo  de  confianza  de  95%  para 
(/a,  —  /ju2).  ^Este  intervalo  confirma  sus  conclusiones 
del  inciso  a)? 


9.28  Ruido  y  estres  En  el  ejercicio  8.48,  usted 
comparo  el  efecto  del  estres  en  la  forma  de  ruido  sobre 
la  capacidad  para  realizar  una  tarea  sencilla.  Setenta 
personas  se  dividieron  en  dos  grupos;  el  primer  grupo  de 
30  personas  actuo  como  control,  en  tanto  que  el  segundo 
grupo  de  40  fue  el  grupo  experimental.  Aun  cuando  cada 
persona  realizo  la  tarea  en  el  mismo  cuarto  de  control, 
cada  una  de  las  del  grupo  experimental  tuvo  que  realizar 
la  tarea  al  tiempo  que  se  escuchaba  musica  de  rock  muy 
fuerte.  Se  registro  el  tiempo  para  terminar  la  tarea  para 
cada  persona  y  se  obtuvo  el  siguiente  resumen: 

Control  Experimental 

n  30  40 

x  15minutos  23minutos 

s  4minutos  lOminutos 

a.  7,  Hay  evidencia  suficiente  para  indicar  que  el  tiempo 
promedio  para  terminar  la  tarea  fue  mas  largo  para  el 
grupo  experimental  “musica  de  rock”?  Pruebe  al  nivel 
de  significancia  de  1%. 

b.  Construya  un  lfmite  superior  de  99%  de  una  cola  para 
la  diferencia  (control  —  experimental)  en  tiempos 
promedio  para  los  dos  grupos.  ^Este  intervalo 
confirma  sus  conclusiones  del  inciso  a)? 

9.29  ^Que  es  normal  II?  De  las  130  personas  del 
ejercicio  9.16,  65  eran  mujeres  y  65  hombres.3  Las 
medias  y  desviaciones  estandar  de  sus  temperaturas  se 
indican  a  continuation. 

Hombres  Mujeres 

Media  muestral  98.11  98.39 

Desviacion  estandar  0.70  0.74 

a.  Use  el  metodo  del  valor  p  para  una  diferencia 
significativa  en  las  temperaturas  promedio  para 
hombres  contra  mujeres. 

b.  t,Los  resultados  son  importantes  al  nivel  del  5%? 

{Y  al  nivel  del  1%? 


UNA  PRUEBA  DE  HIPOTESIS  DE  MUESTRAS 
GRANDES  PARA  UNA  PROPORCION 
BINOMIAL 

Cuando  una  muestra  aleatoria  de  n  intentos  identicos  se  saca  de  una  poblacion  binomial, 
la  proportion  muestral  p  tiene  una  distribution  aproximadamente  normal  cuando  n  es 
grande,  con  media  p  y  error  estandar 


SE  = 
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Cuando  se  prueba  una  hipotesis  acerca  de  p,  la  proportion  en  la  poblacion  que  posee 
cierto  atributo,  la  prueba  sigue  la  misma  forma  general  que  las  pruebas  de  muestra 
grande  de  la  section  9.3  y  9.4.  Para  probar  una  hipotesis  de  la  forma 


H0:p=  p0 


contra  una  alternativa  de  una  o  de  dos  colas 

Hd:p>p0  o  Ha:p<p0  o  H,:p  =£  pn 

la  estadfstica  de  prueba  se  construye  usando  p,  el  mejor  estimador  de  la  verdadera 
proportion  poblacional  p.  La  proportion  muestral  p  es  estandarizada,  usando  la  media 
hipotetica  y  error  estandar,  para  formar  una  estadfstica  de  prueba  z,  que  tiene  una  dis¬ 
tribution  normal  estandar  si  H0  es  verdadera.  Esta  prueba  de  muestra  grande  se  resume 
a  continuation. 


PRUEBA  ESTADISTICA  DE  MUESTRAS  GRANDES  PARA  p 

1 .  Hipotesis  nula:  H0:  p  =  p0 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

Ha:p>  p0  H^.p=f=p0 

(o  Ha :  p  <  pQ) 


3 


z  >  za  z>  Zed 2  o  bien  z  <  ~zan 

(o  z  <  —za  cuando  la  hipotesis 

alternativa  sea  Ha  :  p  <  p„) 
o  cuando  el  valor  p  <  a 


x 

P=~ 

n 


donde  x  es  el  numero  de  exitos  en  n  intentos  binomiales.' 

Region  de  rechazo:  rechazar  H0  cuando 

Prueba  de  una  cola  Prueba  de  dos  colas 


Estadfstico  de  prueba:  z  = 


p-  Pa  P~  Pa 


SE 


I  Poqo 


con 


Suposicion:  El  muestreo  satisface  las  suposiciones  de  un  experimento  binomial 
(vease  la  section  5.2)  y  n  es  lo  suficientemente  grande  para  que  la  distribution  mues¬ 
tral  de  p  puede  ser  aproximada  por  una  distribution  normal  ( np0  >  5  y  nq0  >5). 


Un  estadfstico  muestral  o  de  prueba  equivalente  se  puede  hallar  multiplicando  el  numerador  y  denominador  por  z 
por  n  para  obtener 


z  = 


x  —  np0 
V»Mo 
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A  cualquier  edad,  alrededor  de  20%  de  estadounidenses  adultos  participan  en  activi- 
dades  de  acondicionamiento  ffsico  al  menos  dos  veces  a  la  semana.  No  obstante,  estas 
actividades  cambian  a  medida  que  las  personas  envejecen  y,  ocasionalmente,  los  parti- 
cipantes  se  convierten  en  no  participantes.  En  una  encuesta  local  de  n  =  100  adultos  de 
mas  de  40  anos,  un  total  de  15  personas  indicaron  que  participaron  en  estas  actividades 
al  menos  dos  veces  a  la  semana.  /Estos  datos  indican  que  el  porcentaje  de  participation 
para  adultos  de  mas  de  40  anos  de  edad  es  considerablemente  menor  a  la  cifra  de  20%? 
Calcule  el  valor  p  y  uselo  para  sacar  las  conclusiones  apropiadas. 


Solution  Suponiendo  que  el  procedimiento  de  muestreo  satisfaga  los  requisitos  de 
un  experimento  binomial,  se  puede  contestar  la  pregunta  planteada  usando  una  prueba 
de  hipotesis  de  una  cola: 


H0:  p  =  .2  contra  Ha :  p  <  .2 


CONSEJO 


Valor  p  £  a  o  rechazar  H0. 
Valor  p>  a<=>  no  rechazar  H„. 


Empiece  por  suponer  que  H0  es  verdadera,  es  decir,  el  verdadero  valor  de  p  es  p0  =  .2. 
Entonces  p  =  x/n  tendra  una  distribution  normal  aproximada  con  media  p0  y  error  estan- 
dar  \p0q0/n.  (nota:  Esto  es  diferente  del  procedimiento  de  estimation  en  el  que  el  error 
estandar  desconocido  es  estimado  por  \Jpqln.)  El  valor  observado  de  p  es  15/100  =  .15 
y  el  estadistico  de  prueba  es 

p-p0  -15  ~  .20  =  ^ 

(•20X.80) 

100 


FIGURA  9.1  2 

Valor  p  para  el 
ejemplo  9.11 


El  Valor  p  asociado  con  esta  prueba  se  encuentra  como  el  area  bajo  la  curva  normal 
estandar  a  la  izquierda  de  z  =  — 1.25  como  se  ve  en  la  figura  9.12.  Por  tanto, 

Valor  p  =  P(z  <  -1.25)  =  .1056 


Si  el  investigador  usa  las  gufas  para  evaluar  valores  p,  entonces  .1056  es  mayor  que  .10 
y  no  rechazarfa  H0.  Hay  suficiente  evidencia  para  concluir  que  el  porcentaje  de  adultos 
de  mas  de  40  anos  que  participan  en  actividades  de  acondicionamiento  ffsico  dos  veces 
a  la  semana  es  menor  a  20%. 


Significancia  estadfstica  e  importancia 
practica 

Es  importante  entender  la  diferencia  entre  resultados  que  sean  “significativos”  y  resulta- 
dos  que  son  practicamente  “importantes”.  En  lenguaje  de  estadfstica,  la  palabra  signifi¬ 
cative)  no  necesariamente  quiere  decir  “importante”,  sino  solo  que  los  resultados  podrfan 
no  haber  ocurrido  por  casualidad.  Por  ejemplo,  suponga  que  en  el  ejemplo  9.11,  la 
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investigation  habfa  empleado  n  =  400  adultos  en  su  experimento  y  habfa  observado  la 
misma  proporcion  muestral.  El  estadfstico  de  prueba  es  ahora 


P  ~Po 


.15  -  .20 


(■20)(.80) 

400 


-1.25 


con 


Valor p  =  P(z  <  -2.50)=  .0062 

Ahora  los  resultados  son  altamente  significativos :  H0  es  rechazada  y  hay  subciente 
evidencia  para  indicar  que  el  porcentaje  de  adultos  de  mas  de  40  anos  que  participan 
en  actividades  de  acondicionamiento  ffsico  es  menor  a  20%.  No  obstante,  <  esta  baja  en 
actividad  es  realmente  importantel  Supongamos  que  los  medicos  estarfan  preocupados 
solo  por  una  baja  en  actividad  ffsica  de  mas  de  10%.  Si  hubiera  habido  una  baja  de  mas 
de  10%  en  actividad  ffsica,  esto  implicarfa  que  el  verdadero  valor  de  p  era  menor  a  .10. 
(  Cual  es  el  maximo  valor  posible  de  pi  Usando  un  lfmite  de  conbanza  de  95%  de  una 
cola,  tendremos 

p  +  1.645  3 
V  n 


.15  + 


1.645 


U5X.85) 

400 


.15  +  .029 

o  sea p  <  .179.  La  actividad  ffsica  para  adultos  de  40  anos  o  mas  ha  bajado  de  20%  pero 
no  se  puede  decir  que  haya  bajado  por  debajo  de  10%.  Entonces,  los  resultados,  aun 
cuando  estadisticamente  significativos,  no  son  prdcticamente  importantes. 

En  este  libro,  usted  aprendera  a  determinar  si  los  resultados  son  estadisticamente 
signihcativos  pero,  cuando  use  estos  procedimientos  en  una  situacion  practica,  tambien 
debe  asegurarse  que  los  resultados  sean  practicamente  importantes. 


0 


EJERCICIOS 


TECNICAS  BASICAS 

9.30  Una  muestra  aleatoria  de  n  =  1000  observaciones 

de  una  poblacion  binomial  produjo  x  =  279. 

a.  Si  su  hipotesis  de  investigacion  es  que  p  sea  menor  a 
.3,  (:,quc  debe  escoger  para  su  hipotesis  alternativa? 
fiY  para  su  hipotesis  nula? 

b.  ('Cual  es  el  valor  crftico  que  determina  la  region  de 
rechazo  para  su  prueba  con  a  =  .05? 

c.  <',Los  datos  dan  subciente  evidencia  para  indicar  que  p 
es  menor  a  .3?  Use  un  nivel  de  signibcancia  de  5%. 


b.  Calcule  el  estadfstico  de  prueba  y  su  valor  p.  Use  el 
valor  p  para  evaluar  la  signibcancia  estadfstica  de  los 
resultados  al  nivel  del  1%. 

c.  (',Los  datos  dan  subciente  evidencia  para  indicar  que  p 
es  diferente  de  .4? 

9.32  Una  muestra  aleatoria  de  120  observaciones  fue 
seleccionada  de  una  poblacion  binomial  y  se  observaron  72 
exitos.  (',Los  datos  dan  subciente  evidencia  para  indicar  que 
p  es  mayor  a  .5?  Use  uno  de  los  dos  metodos  de  prueba 
presentados  en  esta  section  y  explique  sus  conclusiones. 


9.31  Una  muestra  aleatoria  de  n  =  1400  observaciones 
de  una  poblacion  binomial  produjo  x  =  529. 

a.  Si  la  hipotesis  de  su  investigacion  es  que  p  dibera  de 
.4,  (-cuales  hipotesis  debe  probar? 


APLICACIONES 

9.33  Obesidad  infantil  Segun  la  encuesta  “What 
America  Eats”  (Lo  que  comen  en  Estados  Unidos) 
de  la  re  vista  PARADE  donde  intervienen  n  =  1015 
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adultos,  casi  la  mitad  de  los  padres  dicen  que  el  peso 
de  sus  hijos  esta  bien.8  Solo  9%  de  los  padres  describen 
a  sus  hijos  como  obesos.  No  obstante,  la  Asociacion 
Americana  de  Obesidad  dice  que  el  numero  de  ninos  y 
adolescentes  con  sobrepeso  es  al  menos  15%.  Suponga 
que  el  numero  de  padres  de  la  muestra  es  n  =  750  y 
el  numero  de  padres  que  describen  a  sus  hijos  como 
obesos  es  x  =  68. 

a.  /  Como  procederfa  para  probar  la  hipotesis  de  que  la 
proporcion  de  padres  que  describen  a  sus  hijos  como 
obesos  es  menor  que  la  proporcion  real  publicada  por 
la  Asociacion  Americana  de  Obesidad? 

b.  /Que  conclusion  se  puede  sacar  de  estos  datos  al  nivel 
de  significancia  de  a  =  .05? 

c.  /dual  es  el  valor  p  asociado  con  esta  prueba? 

9.34  Genetica  de  plantas  Una  peonia  con  petalos 
rojos  fue  cruzada  con  otra  planta  que  tenia 

petalos  rayados.  Un  genetista  dice  que  75%  de  los 
descendientes  que  resulten  de  esta  cruza  tendran  flores 
rojas.  Para  probar  su  dicho,  100  semillas  de  esta  cruza  se 
seleccionaron  y  germinaron,  y  58  plantas  tenfan  petalos 
rojos. 

a.  /Que  hipotesis  debe  usarse  para  probar  lo  dicho  por  el 
genetista? 

b.  Calcule  el  estadfstico  de  prueba  y  su  valor  p.  Use  el 
valor  p  para  evaluar  la  significancia  estadfstica  de  los 
resultados  al  nivel  del  1%. 

9.35  Deteccion  temprana  del  cancer  de  pecho  De 

las  mujeres  a  las  que  se  diagnostico  cancer  de  pecho 
en  su  etapa  temprana,  un  tercio  murieron  finalmente 
de  la  enfermedad.  Suponga  que  el  departamento  de 
salud  publica  de  una  comunidad  instituyo  un  programa 
de  seleccion  para  la  deteccion  temprana  de  ese  cancer 
y  aumentar  el  porcentaje  de  sobrevivencia  p  de  las 
diagnosticadas  con  la  enfermedad.  Una  muestra  aleatoria 
de  200  mujeres  se  selecciono  de  entre  las  que  eran 
seleccionadas  periodicamente  por  el  programa  y  a  las 
que  se  les  diagnostico  la  enfermedad.  Con  x 
representemos  el  numero  de  las  de  la  muestra  que 
sobreviven  a  la  enfermedad. 

a.  Si  se  desea  detectar  si  el  programa  de  seleccion  ha 
sido  efectivo,  exprese  la  hipotesis  nula  que  deba 
probarse. 

b.  Indique  la  hipotesis  alternativa. 

c.  Si  164  mujeres  de  la  muestra  de  200  sobreviven  a 
la  enfermedad,  /se  puede  concluir  que  el  programa 
de  seleccion  de  la  comunidad  fue  efectivo?  Pruebe 
usando  a  =  .05  y  explique  las  conclusiones  practicas 
a  partir  de  su  prueba. 

d.  Encuentre  el  valor  p  para  la  prueba  e  interpreted. 


9.36  Mosca  blanca  de  la  remolacha  Suponga 
que  10%  de  los  campos  en  una  zona  agricola  dada  esta 
infestado  de  la  mosca  blanca  de  la  remolacha.  Cien 
campos  de  esta  zona  se  seleccionan  al  azar  y  se  encuentra 
que  25  de  ellos  estan  infestados  de  la  mosca  blanca. 

a.  Suponiendo  que  el  experimento  satisface  las 
condiciones  del  experimento  binomial,  /los  datos 
indican  que  la  proporcion  de  campos  infestados  es 
mayor  de  lo  esperado?  Use  el  metodo  del  valor  p  y 
pruebe  usando  un  nivel  de  significancia  del  5%. 

b.  Si  se  encuentra  que  la  proporcion  de  campos 
infestados  es  significativamente  mayor  a  .10,  /por  que 
es  esto  de  significancia  practica  para  la  agronoma? 
/Que  conclusiones  practicas  podrfa  ella  sacar  de  los 
resultados? 

9.37  /Cafe  o  azul?  Un  artfculo  del  Washington 
Post  expreso  que  casi  45%  de  la  poblacion  de 
estadounidenses  nace  con  ojos  cafes,  aun  cuando  no 
necesariamente  siguen  asf.9  Para  probar  lo  dicho  por 
el  periodico,  se  selecciono  una  muestra  aleatoria  de  80 
personas  y  32  de  ellas  tenfan  ojos  cafes.  /Hay  suficiente 
evidencia  para  impugnar  lo  dicho  por  el  periodico 
respecto  a  la  proporcion  de  personas  de  ojos  cafes  en 
Estados  Unidos?  Use  a  =  .01. 

9.38  Lentes  de  contacto  a  colores  Consulte  el 
ejercicio  9.37.  Los  lentes  de  contacto,  que  usan  unos  26 
millones  de  estadounidenses,  vienen  en  numerosos  estilos 
y  colores.  Casi  todas  las  personas  usan  lentes  suaves, 
siendo  los  mas  populares  las  variedades  azules  (25%), 
seguidos  de  verdes  (24%)  y  luego  color  de  avellana 

o  cafes.  Se  reviso  el  color  de  lentes  de  una  muestra 
aleatoria  de  80  usuarios  de  lentes  de  contacto  de  color 
y,  de  estas  personas,  22  usaban  lentes  azules  y  solo  15 
usaban  lentes  verdes.9 

a.  /Los  datos  muestrales  dan  suficiente  evidencia  para 
indicar  que  la  proporcion  de  usuarios  de  lentes  de 
contacto  a  color  que  usan  lentes  azules  es  diferente 
de  25%?  Use  a  =  .05. 

b.  /Los  datos  muestrales  dan  suficiente  evidencia  para 
indicar  que  la  proporcion  de  usuarios  de  lentes  de 
contacto  a  color  que  usan  lentes  verdes  es  diferente 
de  24%?  Use  a  =  .05. 

c.  /Hay  alguna  razon  para  efectuar  una  prueba  de  una 
cola  ya  sea  para  el  inciso  a)  o  el  b)?  Explique. 

9.39  Una  cura  para  el  insomnio  Un  experimentador 
ha  preparado  un  nivel  de  dosis  de  medicamento  que 

dice  inducira  el  sueno  al  menos  a  80%  de  las  personas 
que  suman  de  insomnio.  Despues  de  examinar  la  dosis, 
pensamos  que  su  cifra  respecto  a  la  efectividad  de  su 
dosis  esta  inflada.  En  un  intento  para  refutar  su  dicho, 
administramos  su  dosis  prescrita  a  50  personas  con 
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insomnio  y  observamos  que  37  de  ellos  habfan  tenido 
sueno  inducido  por  la  dosis  del  medicamento.  (',Hay 
suficiente  evidencia  para  refutar  su  dicho  al  nivel 
de  significancia  de  5%? 

9.40  iQuien  vota?  Alrededor  de  tres  cuartas  partes 
del  electorado  de  Estados  Unidos  estan  registrados  para 
votar,  pero  muchos  no  se  molestan  en  votar  el  dfa  de 
elecciones.  Solo  64%  votaron  en  1992  y  60%  en  2000, 
pero  la  concurrencia  en  elecciones  fuera  del  ano  es 
incluso  mas  baja.  Un  artfculo  en  el  Time  dijo  que  35% 
de  adultos  estadounidenses  son  votantes  registrados 
que  siempre  votan.10  Para  probar  esto,  se  selecciono 
una  muestra  aleatoria  de  n  =  300  ciudadanos  y  x  =  123 
eran  votantes  regulares  registrados  que  siempre  votaban. 


(:,Esta  muestra  da  suficiente  evidencia  para  indicar  que 
el  porcentaje  de  adultos  que  dicen  que  siempre  votan  es 
diferente  del  porcentaje  publicado  en  el  Timel  Pruebe 
usando  a  =  .01. 

9.41  El  mejor  amigo  del  hombre  La  Sociedad 
protectora  de  animales  informa  que  hay  alrededor 
de  65  millones  de  perros  en  Estados  Unidos  y  que 
aproximadamente  40%  de  todas  las  familias  en  Estados 
Unidos  tienen  al  menos  un  perro.11  En  una  muestra 
aleatoria  de  300  familias,  1 14  dijeron  que  tenian  al  menos 
un  perro.  ^Estos  datos  dan  suficiente  evidencia  para 
indicar  que  la  proportion  de  familias  con  al  menos  un 
perro  es  diferente  de  la  publicada  por  la  Humane  Society? 
Pruebe  usando  a  =  .05. 


UNA  PRUEBA  DE  HIPOTESIS 
DE  MUESTRAS  GRANDES  PARA 
LA  DIFERENCIA  ENTRE  DOS 
PROPORCIONES  BINOMIALES 

Cuando  se  seleccionaron  muestras  aleatorias  e  independientes  de  dos  poblaciones  bino- 
miales,  el  punto  central  del  experimento  puede  ser  la  diferencia  (/a  —  p2)  en  las  pro- 
porciones  de  individuos  u  objetos  que  poseen  una  caracterfstica  especificada  en  las 
dos  poblaciones.  En  esta  situation,  usted  puede  usar  la  diferencia  en  las  proporciones 
muestrales  ( px  —  p2)  junto  con  su  error  estandar, 


SE 


p \<t 

,  PiQz 

/  nx 

en  la  forma  de  un  estadfstico  z  para  probar  una  diferencia  significativa  en  las  dos  propor¬ 
ciones  poblacionales.  La  hipotesis  nula  a  probarse  suele  ser  de  la  forma 


Ho  ■  Pi  =  Pi  o  H0:  (pi  ~  p2)  =  0 


CONSEJO 


Recuerde:  Cada  intento 
resulta  en  uno  de 
dos  resultados  (E  o  F). 


contra  una  hipotesis  alternativa  ya  sea  de  una  cola  o  de  dos  colas.  La  prueba  formal  de 
hipotesis  se  resume  en  la  siguiente  plana.  Al  estimar  el  error  muestral  para  el  estadfstico 
z,  se  debe  usar  el  hecho  de  que  cuando  H0  es  verdadera,  las  dos  proporciones  poblacio¬ 
nales  son  iguales  a  algun  valor  comun,  por  ejemplo  p.  Para  obtener  la  mejor  estimacion 
de  este  valor  comun,  los  datos  muestrales  son  “agrupados”  y  la  estimacion  de  p  es 

~  _  Niirncro  total  de  exitos  _  -U  +  x2 

'  Numero  total  de  intentos  «i  +  n2 

Recuerde  que,  para  que  la  diferencia  de  las  proporciones  muestrales  tengan  una  dis¬ 
tribution  aproximadamente  normal,  los  tamanos  muestrales  deben  ser  grandes  y  las 
proporciones  no  deben  estar  demasiado  cerca  de  0  o  1 . 
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E  J  E  M  P  L 


PRUEBA  ESTADISTICA  DE  MUESTRAS  GRANDES 
PARA  (p,  -  p2) 


1.  Hipotesis  nula:  H0:  (px  —  p2)  =  0  o  equivalentemente  H0:  px  =  p2 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

:  (Pi  -  Pi)  >  0  :  (pj  ~  p2)  =/=  0 

[o//a :  (Pi  ~  Pi)  <  0] 

3.  Estadistico  de  prueba:  z  =  — — Mr - —  =  —  — 

/Ml  |  a# 

V  «i  A 

donde  px  =  Xj/n,  y  p2  =  x2/n2.  Como  el  valor  comun  de  px  =  p2  =  p  (empleado  en 
el  error  estandar)  se  desconoce,  se  estima  con 


A  ~A> 

I El  +  PI 


n, 


n2 


„  _  +  x2 

u,  +  n2 

y  el  estadistico  de  prueba  es 


z  = 


(Pi  ~  Pi)  ~  0 

/M  +  M 

'  «1  «2 


o 


Pi  -  Pi 


4.  Region  de  rechazo:  rechazar  //0  cuando 

Prueba  de  una  cola  Prueba  de  dos  colas 

z  >  za  z>  Zoji  o  bien  z  <  — Za/2 

[o  z  <  — z„  cuando  la  hipotesis 
alternativa  es  Hd :  ip  —  p2)  <  0] 

o  cuando  el  valor  p  <  a 


Suposiciones:  Las  muestras  son  seleccionadas  al  azar  y  de  manera  independiente 
de  las  dos  poblaciones,  nl  y  n2  son  grandes  lo  suficiente  para  que  la  distribucion 
muestral  de  (pt  —  p2)  pueda  ser  aproximada  por  una  distribucion  normal.  Esto  es, 
n,ph  nxqu  n2p2  y  n2q2  deben  ser  mayores  a  5  todas. 


Los  registros  de  un  hospital  indican  que  52  hombres  de  una  muestra  de  1000  contra  23 
mujeres  de  una  muestra  de  1000  fueron  ingresados  por  enfermedad  del  corazon.  ^Estos 
datos  presentan  suficiente  evidencia  para  indicar  un  porcentaje  mas  alto  de  enfermeda- 
des  del  corazon  entre  hombres  ingresados  al  hospital?  Use  a  =  .05. 


Solucion  Suponga  que  el  numero  de  pacientes  ingresados  por  enfermedad  del  cora¬ 
zon  tiene  una  distribucion  aproximada  binomial  de  probabilidad  para  hombres  y  mujeres 
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FIGURA  9.13 

Ubicacion  de  la  region  de 
rechazo  para  el  ejemplo 
9.12 


con  parametros  /?,  y  p2,  respectivamente.  Entonces,  como  el  investigador  desea  deter- 
minar  si  px  >  p2,  probara  la  hipotesis  nula  pi  =  p2,  es  decir,  H0  :  (pl  —  p2)  =  0  contra 
la  hipotesis  alternativa  Ha  :  px  >  p2  o  bien,  lo  que  es  equivalente,  Ha  :  (p{  —  p2)  >  0. 
Para  efectuar  esta  prueba,  use  el  estadfstico  de  prueba  z  y  aproxime  el  error  estandar 
usando  la  estimacion  agrupada  de  p.  Como  Ha  implica  una  prueba  de  una  cola,  puede 
rechazar  H0  solo  para  valores  grandes  de  z.  Entonces,  para  a  =  .05,  puede  rechazar  H0  si 
z  >  1.645  (vease  la  figura  9.13). 

La  estimacion  agrupada  de  p  requerida  para  el  error  estandar  es 


x1  +  x2 
nx  +  n2 


52  +  23 

1000  +  1000 


=  .0375 


Kz) 


/ 


a  =  .05 


1.645  z 

k - Region  de  rechazo 


y  el  estadfstico  de  prueba  es 
Pi~  Pi 


.052  -  .023 


I  (.0375)(.9625)| 


1 

1000 


3.41 


Como  el  valor  calculado  de  z  cae  en  la  region  de  rechazo,  puede  rechazar  la  hipotesis 
de  que  p x  =  p2.  Los  datos  presentan  suficiente  evidencia  para  indicar  que  el  porcen- 
taje  de  hombres  que  ingresan  al  hospital  por  enfermedad  del  corazon  es  mas  alto  que 
el  de  mujeres.  (nota:  Esto  no  implica  que  la  incidencia  de  enfermedad  del  corazon 
sea  mas  alta  en  hombres.  jQuiza  menos  mujeres  ingresen  al  hospital  cuando  estan 
afectadas  por  esa  enfermedad!) 

^Cuanto  mas  alta  es  la  proporcion  de  hombres  que  de  mujeres  que  ingresan  al  hos¬ 
pital  con  enfermedad  del  corazon?  Un  lfmite  inferior  de  una  cola  de  95%  de  confianza 
ayudara  a  hallar  el  mfnimo  valor  probable  para  la  diferencia. 


(Pi 


p2)  -  1.645 


+Mi 


n  2 


(.052  -  .023)  -  1.645 


/. 052(.948)  .023(.977) 


1000 


1000 


.029  -  .014 


o  (p i  —  pi)  >  .015.  La  proporcion  de  hombres  es  aproximadamente  1.5%  mas  alta  que 
de  mujeres.  2, Esto  es  de  importancia  practical  Esta  es  una  pregunta  para  que  el  investi¬ 
gador  conteste. 


En  algunas  situaciones  puede  ser  necesario  probar  para  una  diferencia  D„  (que  no 
sea  0)  entre  dos  proporciones  binomiales.  Si  este  es  el  caso,  la  estadfstica  de  prueba  se 
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modifica  para  probar  H0:{p i  —  p2)  =  D0,  y  una  estimacion  agrupada  para  un  p  comun  ya 
no  se  usa  en  el  error  estandar.  El  estadfstico  de  prueba  modificado  es 


z  = 


(P\  ~  p2)  ~  D0 


/M 

,  P-A 

V  rii 

n2 

Aun  cuando  este  estadfstico  de  prueba  no  se  usa  con  frecuencia,  el  procedimiento  no  es 
diferente  de  otras  pruebas  de  muestra  grande  que  ya  hemos  aprendido. 


EJERCICIOS 


TECNICAS  BASICAS 

9.42  Muestras  aleatorias  independientes  de  n,  =  140 
y  n2  =  140  observaciones  se  seleccionaron  al  azar  de 
las  poblaciones  binomiales  1  y  2,  respectivamente.  La 
muestra  1  tuvo  74  exitos  y  la  muestra  2  tuvo  8 1  exitos. 

a.  Suponga  que  no  se  tiene  idea  preconcebida  en  cuanto 
a  cual  parametro,  p,  o  p2,  es  el  mayor,  pero  se  desea 
detectar  solo  una  diferencia  entre  los  dos  parametros 
si  existe  una.  /  Cual  escogerfa  usted  como  hipotesis 
alternativa  para  una  prueba  estadfstica?  /La  hipotesis 
nula? 

b.  Calcule  el  error  estandar  de  la  diferencia  en  las  dos 
proporciones  muestrales,  (p,  —  p2).  Asegurese  de  usar 
la  estimacion  agrupada  para  el  valor  comun  de  p. 

c.  Calcule  el  estadfstico  de  prueba  que  usarfa  para  la 
prueba  del  inciso  a).  Con  base  en  su  conocimiento 
de  la  distribution  normal  estandar,  /esta  observation 
es  probable  o  es  improbable,  suponiendo  que  H0  sea 
verdadera  y  las  dos  proporciones  poblacionales  son 
iguales? 

d.  Metodo  del  valor  p:  Encuentre  el  valor  p  para  la 
prueba.  Pruebe  para  una  diferencia  significativa 
de  las  proporciones  poblacionales  al  nivel  de 
significancia  del  1%. 

e.  Metodo  del  valor  critico :  Encuentre  la  region  de 
rechazo  cuando  a  =  .01.  /Los  datos  dan  suficiente 
evidencia  para  indicar  una  diferencia  en  las 
proporciones  poblacionales? 

9.43  Consulte  el  ejercicio  9.42.  Suponga,  por  razones 
practicas,  que  sabe  que  p,  no  puede  ser  mayor  que  p2. 

a.  Dado  este  conocimiento,  /que  deberfa  escoger  como 
hipotesis  alternativa  para  su  prueba  estadfstica? 

/Y  la  hipotesis  nula? 

b.  /Su  hipotesis  alternativa  del  inciso  a)  implica  una 
prueba  de  una  o  de  dos  colas?  Explique. 

c.  Realice  la  prueba  y  exprese  sus  conclusiones.  Pruebe 
usando  a  =  .05. 


9.44  Muestras  aleatorias  independientes  de  280  y 
350  observaciones  se  seleccionaron  de  poblaciones 
binomiales  1  y  2,  respectivamente.  La  muestra  1 
tuvo  132  exitos  y  la  muestra  2  tuvo  178  exitos.  /Los 
datos  presentan  suficiente  evidencia  para  indicar  que 
la  proporcion  de  exitos  en  la  poblacion  1  es  menor 
que  la  proporcion  en  la  poblacion  2?  Use  uno  de  los 
dos  metodos  de  prueba  presentados  en  esta  seccion  y 
explique  sus  conclusiones. 

APLICACIONES 

9.45  Tratamiento  contra  control  Serealizo 
un  experimento  para  probar  el  efecto  de  un  nuevo 
medicamento  en  una  infeccion  viral.  La  infeccion  fue 
inducida  en  100  ratones  y  estos  se  dividieron  al  azar  en 
dos  grupos  de  50.  El  primer  grupo,  el  grupo  de  control, 
no  recibio  tratamiento  para  la  infeccion;  el  segundo  grupo 
recibio  el  medicamento.  Despues  de  un  periodo  de  30 
dfas,  las  proporciones  de  sobrevivientes,  pt  y  p2,  en  los 
dos  grupos  se  encontraron  de  .36  y  .60,  respectivamente. 

a.  /Hay  evidencia  suficiente  para  indicar  que  el 
medicamento  es  efectivo  para  tratar  la  infeccion  viral? 
Use  a  =  .05. 

b.  Use  un  intervalo  de  confianza  de  95%  para  estimar  la 
diferencia  real  en  los  porcentajes  de  curacion  para  los 
grupos  tratados  contra  los  de  control. 

9.46  Marketing  en  cine  El  marketing  a  grupos 
objetivo  por  edades  se  ha  convertido  en  un  metodo 
de  publicidad,  incluso  en  anuncios  en  los  cines.  Los 
anunciadores  usan  software  para  rastrear  la  demograffa 
de  espectadores  y  luego  decidir  el  tipo  de  productos 

a  anunciar  antes  de  una  pelfcula  en  particular.12  Un 
estadfstico  que  podrfa  ser  de  interes  es  la  frecuencia  con 
la  que  adultos  e  hijos  de  menos  de  18  anos  asisten  al  cine 
en  comparacion  con  los  adultos  sin  hijos.  Suponga  que 
la  base  de  datos  de  un  cine  se  utiliza  para  seleccionar  al 
azar  mil  compradores  adultos  de  boletos.  Estos  adultos 
son  encuestados  despues  y  se  les  pregunta  si  eran 
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espectadores  frecuentes  en  el  cine,  es  decir,  /van  al  cine 
12  o  mas  veces  al  ano?  Los  resultados  se  muestran  en  la 
tabla: 

Con  hijos 


menores  Sin 

de  18  hijos 


Tamano  muestral  440  560 

Numero  que  van  12  o  mas  veces  al  ano  123  145 


a.  /Hay  diferencia  significativa  en  las  proporciones 
poblacionales  de  espectadores  frecuentes  en  estos  dos 
grupos  demograficos?  Use  a  =  .01. 

b.  (',Por  que  una  diferencia  estadfsticamente  significativa 
en  estas  proporciones  poblacionales  serfa  de 
importancia  practica  para  el  anunciante? 

9.47  M&M'S  En  el  ejercicio  8.53,  investigamos  si 
Mars,  Inc.,  usa  la  misma  proporcion  de  M&M’S  en  sus 
variedades  sencillas  y  de  cacahuate.  Muestras  aleatorias 
de  M&M’S  sencillas  y  de  cacahuate  dan  los  siguientes 
datos  muestrales  para  el  experimento: 

Sencillo  Cacahuate 

Tamano  muestral  56  32 

Numero  de  M&M'S  rojos  12  8 

Use  una  prueba  de  hipotesis  para  determinar  si  hay  una 
diferencia  significativa  en  las  proporciones  de  dulces 
rojos  para  los  dos  tipos  de  M&M’S.  Sea  a  =  .05  y 
compare  sus  resultados  con  los  del  ejercicio  8.53. 

9.48  Terapia  hormonal  y  enfermedad  de 

Alzheimer  En  los  ultimos  anos,  muchos  estudios  de 
investigation  han  demostrado  que  los  beneficios  que 
se  buscan  con  terapia  hormonal  de  reemplazo  (HRT) 
no  existen  y  de  hecho  esa  terapia  de  cambio  hormonal 
aumenta  el  riesgo  de  varias  enfermedades  graves.  Un 
experimento  de  cuatro  anos  donde  intervinieron  4532 
mujeres,  publicado  en  The  Press  Enterprise,  se  realizo 
en  39  centros  medicos.  La  mitad  de  las  mujeres  tomaron 
placebos  y  la  otra  mitad  tomo  Prempro,  una  terapia 
hormonal  de  reemplazo  que  se  receta  con  frecuencia. 
Hubo  40  casos  de  demencia  en  el  grupo  hormonal  y  21  en 
el  de  placebos.13  /Hay  suficiente  evidencia  para  indicar 
que  el  riesgo  de  demencia  es  mas  alto  para  pacientes  que 
usan  Prempro?  Pruebe  al  nivel  de  significancia  del  1%. 

9.49  HRT,  continua  Consulte  el  ejercicio  9.48. 
Calcule  un  lfmite  inferior  de  una  cola  a  99%  de 
confianza  para  la  diferencia  en  el  riesgo  de  demencia  para 
mujeres  que  usan  terapia  hormonal  de  reemplazo  contra 
las  que  no  lo  usan.  /Esta  diferencia  serfa  de  importancia 
practica  para  una  mujer  que  considera  la  terapia 
hormonal  de  reemplazo  (HRT)?  Explique. 


9.50  Clopidogrel  y  aspirina  Un  gran  estudio  se 
realizo  para  probar  la  efectividad  del  clopidogrel  en 
combinacion  con  aspirina  para  prevenir  ataques  al 
corazon  y  cerebrales.14  La  prueba  abarco  mas  de  15  500 
personas  de  45  anos  o  mas  de  32  pafses,  incluyendo 
Estados  Unidos,  a  las  que  se  les  habfa  diagnosticado 
enfermedad  cardiovascular  y  tenfan  multiples  factores  de 
riesgo.  Las  personas  fueron  asignadas  al  azar  a  uno 

de  dos  grupos.  Despues  de  dos  anos,  no  hubo  diferencia 
en  el  riesgo  de  ataque  al  corazon,  ataque  cerebral  o 
muerte  por  enfermedad  cardiaca  entre  quienes  tomaron 
clopidogrel  y  baja  dosis  de  aspirina  al  dfa  y  quienes 
tomaron  aspirina  en  baja  dosis  mas  una  pfldora  falsa.  La 
combinacion  de  dos  medicamentos  en  realidad  aumento 
el  riesgo  de  muerte  (5.4%  contra  3.8%)  o  muerte 
especfficamente  por  enfermedad  cardiovascular  (3.9% 
contra  2.2%). 

a.  Las  personas  se  asignaron  al  azar  a  uno  de  dos  grupos. 
Explique  como  podrfa  usar  la  tabla  numerica  aleatoria 
para  hacer  estas  asignaciones. 

b.  No  se  dieron  tamanos  muestrales  en  el  artfculo:  no 
obstante,  supongamos  que  los  tamanos  muestrales 
para  cada  grupo  fueron  n,  =  7720  y  n2  =  7780. 
Determine  si  el  riesgo  de  morir  era  significativamente 
diferente  para  los  dos  grupos. 

c.  /Que  quieren  decir  los  resultados  en  terminos  de 
significancia  practical 

9.51  Posicion  de  dormir  de  un  bebe  /La  posicion 
de  dormir  de  un  bebe  afecta  el  desarrollo  de  habilidad 
motora?  En  un  estudio,  publicado  en  los  Archives  of 
Pedriatic  Adolescent  Medicine,  343  infantes  de  tiempo 
complete  fueron  examinados  en  sus  revisiones  de 
cuatro  meses  en  busca  de  varios  puntos  importantes  de 
desarrollo,  por  ejemplo  voltearse,  sujetar  una  sonaja, 
alcanzar  un  objeto,  etcetera.15  La  posicion  predominante 
de  dormir  en  bebes,  ya  sea  boca  abajo  (sobre  su 
estomago),  de  espaldas  o  de  lado,  fue  determinada  en 
una  entrevista  telefonica  con  los  padres.  Los  resultados 
muestrales  para  320  de  los  343  infantes  de  quienes  se 
recibio  information  fueron  como  sigue: 

Boca  abajo  Boca  arriba  o  de  costado 

Numero  de  infantes  121  199 

Numero  que  se  volteaban  93  119 

El  investigador  informo  que  era  menos  probable  que 
los  infantes  que  dormfan  de  costado  o  de  espaldas  se 
voltearan,  en  la  revision  de  cuatro  meses,  que  los  que 
dormfan  principalmente  boca  abajo  (P  <  .001).  Use  una 
prueba  de  muestra  grande  para  confirmar  o  refutar  la 
conclusion  del  investigador. 
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ALGUNOS  COMENTARIOS  SOBRE 
LAS  HIPOTESIS  DE  PRUEBA 

Una  prueba  estadfstica  de  hipotesis  es  un  procedimiento  bien  definido  que  hace  posible 
que  un  experimentador  rechace  o  acepte  la  hipotesis  nula  H0,  con  riesgos  medidos  a  y 
f 3 .  El  experimentador  puede  controlar  el  riesgo  de  falsamente  rechazar  H0  al  seleccionar 
un  valor  apropiado  de  a.  Por  el  contrario,  el  valor  de  (3  depende  del  tamano  muestral  y 
de  los  valores  del  parametro  bajo  prueba  que  son  de  importancia  practica  para  el  experi¬ 
mentador.  Cuando  no  se  disponga  de  esta  informacion,  un  experimentador  puede  decidir 
seleccionar  un  tamano  muestral  asequible,  con  la  esperanza  de  que  la  muestra  contendra 
suficiente  informacion  para  rechazar  la  hipotesis  nula.  La  probabilidad  de  que  esta  deci¬ 
sion  sea  erronea  esta  dada  por  a,  cuyo  valor  ha  sido  establecido  por  anticipado.  Si  la 
muestra  no  da  suficiente  evidencia  para  rechazar  H0,  el  experimentador  puede  expresar 
los  resultados  de  la  prueba  como  “Los  datos  no  apoyan  el  rechazo  de  H0”  en  lugar  de 
aceptar  H0  sin  conocer  la  probabilidad  de  error  (3. 

Algunos  experimentadores  prefieren  usar  el  valor  p  observado  de  la  prueba,  para 
evaluar  la  fuerza  de  la  informacion  muestral  al  decidir  rechazar  H0.  Estos  valores  por  lo 
general  pueden  ser  generados  por  computadora  y  con  frecuencia  se  usan  en  informes  de 
resultados  estadfsticos: 


•  Si  el  valor  p  es  mayor  a  .05,  los  resultados  se  publican  como  NS,  es  decir,  no 
significativos,  al  nivel  de  5%. 

•  Si  el  valor  p  se  encuentra  entre  .05  y  .01,  los  resultados  se  publican  como 
P  <  .05  que  es  significativo  al  nivel  de  5%. 

•  Si  el  valor  p  se  encuentra  entre  .01  y  .001,  los  resultados  se  publican  como 
P  <  .01  que  es  “altamente  significativo”  o  significativo  al  nivel  de  1%. 

•  Si  el  valor  p  es  menor  de  .001,  los  resultados  se  publican  como  P  <  .001,  es 
decir,  “muy  altamente  significativos”  o  significativos  al  nivel  de  .1%. 

Otros  investigadores  prefieren  construir  un  intervalo  de  confianza  para  un  parametro 
y  efectuar  una  prueba  de  manera  informal.  Si  el  valor  del  parametro  especificado  por  H0 
esta  incluido  dentro  de  los  lfmites  superior  e  inferior  del  intervalo  de  confianza,  entonces 
“H0  no  es  rechazada”.  Si  el  valor  del  parametro  especificado  por  H0  no  esta  contenido 
dentro  del  intervalo,  entonces  “H0  es  rechazada”.  Estos  resultados  concuerdan  con  una 
prueba  de  dos  colas;  se  usan  lfmites  de  confianza  de  una  cola  para  alternativas  de 
una  cola. 

Por  ultimo,  considere  la  seleccion  entre  una  prueba  de  una  cola  y  una  de  dos  colas. 
En  general,  los  experimentadores  desean  saber  si  un  tratamiento  ocasiona  lo  que  podrfa 
ser  un  aumento  benefico  en  un  parametro  o  que  podrfa  ser  un  decremento  perjudicial  en 
un  parametro.  Por  tanto,  casi  todas  las  pruebas  son  de  dos  colas  a  menos  que  una  prueba 
de  una  cola  sea  dictada  fuertemente  por  consideraciones  practicas.  Por  ejemplo,  suponga 
que  sostendra  una  perdida  financiera  grande  si  la  media  p  es  mayor  que  p0  pero  no  si  es 
menor.  Entonces  usted  deseara  detectar  valores  mayores  a  p,,  con  una  alta  probabilidad 
y  en  consecuencia  usa  una  prueba  de  cola  derecha.  En  el  mismo  estilo,  si  niveles  de 
contamination  mayores  a  p„  producen  riesgos  de  salud  crfticos,  entonces  de  seguro  es 
deseable  detectar  niveles  mas  altos  a  p0  con  una  prueba  de  hipotesis  de  cola  derecha.  En 
cualquier  caso,  la  seleccion  de  una  prueba  de  una  o  de  dos  colas  debe  estar  dictada  por 
las  consecuencias  practicas  que  resultan  de  una  decision  para  rechazar  o  no  rechazar  H0 
a  favor  de  la  alternativa. 
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REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Partes  de  una  prueba  estadfstica 

1.  Hipotesis  nula:  una  contradiction  de  la  hipotesis 
alternativa. 

2.  Hipotesis  alternativa:  la  hipotesis  que  el  investi- 
gador  desea  apoyar. 

3.  Estadistico  de  prueba  y  su  valor  p:  evidencia 
muestral  calculada  de  los  datos  muestrales. 

4.  Region  de  rechazo;  valores  criticos  y  niveles  de 
significancia:  valores  que  separan  rechazo  y  no 
rechazo  de  la  hipotesis  nula. 

5.  Conclusion:  rechazar  o  no  rechazar  la  hipotesis 
nula,  indicando  la  significancia  practica  de  la  con¬ 
clusion  del  usuario. 

II.  Errores  y  significancia  estadfstica 

1 .  El  nivel  de  significancia  a  es  la  probabilidad  de 
rechazar  H0  cuando  de  hecho  es  verdadera. 

2.  El  valor  p  es  la  probabilidad  de  observar  un 
estadistico  de  prueba  como  extremo  o  mas 
extremo  que  el  observado;  tambien,  el  valor  mas 
pequeno  de  a  para  el  que  H0  puede  ser  rechazada. 

3.  Cuando  el  valor  p  es  menor  que  el  nivel  de  sig¬ 
nificancia  a,  la  hipotesis  nula  es  rechazada.  Esto 
ocurre  cuando  el  estadistico  de  prueba  excede 
del  valor  critico. 


4.  En  un  error  Tipo  II,  /3  es  la  probabilidad  de 
aceptar  H0  cuando  de  hecho  es  falsa.  La  potencia 
de  la  prueba  es  (1  —  (3),  la  probabilidad  de 
rechazar  H0  cuando  es  falsa. 


III.  Estadisticos  de  prueba  de  muestra 
grande  usando  distribution  z 

Para  probar  uno  de  los  cuatro  parametros  poblacio- 
nales  cuando  los  tamanos  muestrales  son  grandes, 
use  las  siguientes  estadisticas  de  prueba: 

Parametro  Estadistico  de  prueba 


A 


X  ~  V-a 
s/Vn 


P 


U  x2)  D0 


Ph  P2  (A  P2)  Pq 


EJercicios  suplementarios 

Los  ejercicios  con  asterisco  (*)  son  opcionales. 

9.52  a.  Defina  a  y  fi  para  una  prueba  estadfstica  de 

hipotesis. 

a.  Para  un  tamano  muestral  fijo  n,  si  el  valor  de  a 
disminuye,  ^cual  es  el  efecto  en  /3? 

b.  Para  disminuir  ay  {3  para  un  valor  alternative 
particular  de  /x.  ,;c6mo  debe  cambiar  el  tamano 
muestral? 

9.53  ^Cual  es  el  valor  p  para  una  prueba  de  hipotesis? 

^Como  se  calcula  para  una  prueba  de  muestra  grande? 

9.54  ^Que  condiciones  deben  satisfacerse  para  que  la 

prueba  z  pueda  usarse  para  probar  una  hipotesis  relativa  a 

una  media  poblacional  pP. 


9.55  Defina  la  potencia  de  una  prueba  estadfstica. 

A  medida  que  el  valor  alternative  de  /x  se  aleja  de  /x0, 
(■como  se  afecta  la  potencia? 

9.56  Acidez  de  lluvia  Consulte  el  ejercicio  8.31 
y  la  recoleccion  de  muestras  de  agua  para  estimar  la 
acidez  media  (en  pH)  de  lluvias  en  el  noreste  de  Estados 
Unidos.  Como  se  observo,  el  pH  para  lluvia  pura  que 
cae  en  aire  limpio  es  alrededor  de  5.7.  La  muestra  de 

n  =  40  lluvias  produjo  lecturas  de  pH  con  x  =  3.7 
y  s  =  .5.  (',L°s  datos  dan  suficiente  evidencia  para  indicar 
que  el  pH  medio  para  lluvias  es  mas  acido  (7/a :  p  <  5.7 
pH)  que  el  agua  de  lluvia  pura?  Pruebe  usando  a  =  .05. 
Observe  que  esta  inferencia  es  apropiada  solo  para  el 
area  en  la  que  se  recolectaron  espeefmenes  de  agua  de 
lluvia. 
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9.57  Color  de  maquinas  lavadoras  Un  fabricante 
de  maquinas  lavadoras  automaticas  suministra  un  modelo 
particular  en  uno  de  tres  colores.  De  las  primeras  mil 
lavadoras  vendidas,  se  observa  que  400  eran  del  primer 
color.  (.Puede  usted  concluir  que  mas  de  un  tercio  de 
todos  los  compradores  tienen  preferencia  por  el  primer 
color? 

a.  Encuentre  el  valor  p  para  la  prueba. 

b.  Si  usted  piensa  realizar  su  prueba  usando  a  =  .05, 

('  CLiales  seran  las  conclusiones  de  su  prueba? 

9.58  Proxima  generacion  Nacida  entre  1980  y 
1990,  la  proxima  generacion  fue  el  tema  del  ejercicio 
8. 60. 16  En  una  encuesta  de  500  mujeres  y  500  hombres 
estudiantes  de  la  proxima  generacion,  345  de  las  mujeres 
y  365  hombres  informaron  que  decidieron  estudiar  en  una 
universidad  para  ganar  mas  dinero. 

a.  i,Hay  una  diferencia  significativa  en  las  proporciones 
poblacionales  de  estudiantes  mujeres  y  hombres  que 
decidieron  estudiar  la  universidad  para  ganar  mas 
dinero?  Use  a  =  .01. 

b.  ^Puede  considerar  alguna  razon  por  la  que  una 
diferencia  estadisticamente  significativa  en  estas 
proporciones  poblacionales  podrfa  ser  de  importancia 
practical  i Para  quien  podrfa  ser  importante  esta 
diferencia? 

9.59  Pesca  de  robalo  El  factor  pH  es  una  medida 
de  la  acidez  o  alcalinidad  del  agua.  Una  lectura  de  7.0 
es  neutral;  valores  de  mas  de  7.0  indican  alcalinidad  y, 
debajo  de  7.0  implican  acidez.  Loren  Hill  dice  que  la 
mejor  probabilidad  de  pescar  robalo  es  cuando  el  pH 
del  agua  esta  entre  7.5  y  7.9. 17  Supongamos  que  usted 
sospecha  que  la  lluvia  acida  esta  bajando  el  pH  de  su 
lugar  de  pesca  favorita  y  desea  determinar  si  el  pH  es 
menor  a  7.5. 

a.  Indique  la  hipotesis  alternativa  y  nula  que  escogerfa 
para  una  prueba  estadfstica. 

b.  i  La  hipotesis  alternativa  del  inciso  a)  implica  una 
prueba  de  una  o  de  dos  colas?  Explique. 

c.  Suponga  que  una  muestra  aleatoria  de  30  especfmenes 
de  agua  dieron  lecturas  de  pH  con  x  =  7.3  y  s  =  .2. 
Con  solo  ver  los  datos,  ^piensa  usted  que  la  diferencia 
x  —  7.5  =  —  .2  es  suficientemente  grande  para  indicar 
que  el  pH  medio  de  las  muestras  de  agua  es  menor  a 
7.5?  (No  realice  la  prueba.) 

d.  Ahora  realice  una  prueba  estadfstica  de  las  hipotesis  del 
inciso  a)  e  indique  sus  conclusiones.  Pruebe  usando 

a  =  .05.  Compare  su  decision  basada  estadisticamente 
con  su  decision  intuitiva  del  inciso  c). 

9.60  Loteria  de  Pennsylvania  Un  abogado  de  la 
region  central  de  Pennsylvania  informo  que  el  registro 


de  juicios  de  la  oficina  del  fiscal  de  distrito  (DA)  del 
condado  de  Northumberland  mostro  solo  seis  sentencias 
en  27  juicios  de  enero  a  mediados  de  julio  de  1997. 
Respondieron  cuatro  fiscales  de  distrito  del  condado  de 
Pennsylvania,  “No  nos  juzguen  por  estadfsticas”.18 

a.  Si  la  informacion  del  abogado  es  correcta,  ^rechazarfa 
usted  lo  dicho  por  el  fiscal  de  distrito  de  un  porcentaje 
de  sentencias  de  50%  o  mas? 

b.  Los  registros  reales  muestran  que  ha  habido  455 
declaraciones  de  culpabilidad  y  48  casos  que  han 
tenido  que  ir  a  juicio.  Aun  suponiendo  que  las  455 
declaraciones  de  culpabilidad  sean  solo  sentencias 
de  los  503  casos  publicados,  /cual  es  el  intervalo  de 
confianza  de  95%  para  p,  la  verdadera  proporcion 
de  sentencias  por  este  fiscal  de  distrito? 

c.  Usando  los  resultados  del  inciso  b),  /esta  usted 
dispuesto  a  rechazar  una  cifra  de  50%  o  mayor  para  el 
verdadero  porcentaje  de  sentencias?  Explique. 

9.61  Venado  de  cola  blanca  En  un  artfculo  titulado 
“A  Strategy  for  Big  Bucks”,  Charles  Dickey  examina 
estudios  de  los  habitats  de  venados  de  cola  blanca  que 
indican  que  viven  y  se  alimentan  dentro  de  zonas  de 
distribucion  limitadas,  aproximadamente  de  150  a  205 
acres.19  Para  determinar  si  hubo  una  diferencia  entre 

las  zonas  de  distribucion  de  venados  localizados  en  dos 
zonas  geograficas  diferentes,  se  atraparon,  marcaron  y 
equiparon  con  radiotransmisores  pequenos  40  venados. 
Varios  meses  despues,  los  venados  fueron  rastreados 
e  identificados,  registrandose  la  distancia  x  desde  su 
punto  de  liberacion.  La  media  y  desviacion  estandar  de 
las  distancias  desde  el  punto  de  liberacion  fueron  como 
sigue: 

Lugar  1  Lugar 2 

Tamano  muestral  40  40 

Media  muestral  2980  ft  3205  ft 

Desviacion  estandar  muestral  1140  ft  963  ft 

a.  Si  no  usted  no  tiene  una  razon  preconcebida  para 
pensar  que  una  media  poblacional  es  mas  grande  que 
otra,  /que  escogerfa  para  su  hipotesis  alternativa? 

;Y  para  su  hipotesis  nula? 

b.  /Su  hipotesis  alternativa  del  inciso  a)  implica  una 
prueba  de  una  o  de  dos  colas?  Explique. 

c.  /Los  datos  dan  suficiente  evidencia  para  indicar  que 
las  distancias  medias  difieren  para  los  dos  lugares 
geograficos?  Pruebe  usando  a  =  .05. 

9.62  Modelos  femeninas  En  un  estudio  para  evaluar 
varios  efectos  de  usar  una  modelo  femenina  para  anun- 
ciar  automoviles,  a  cien  hombres  se  les  mostraron  fotogra- 
ffas  de  dos  automoviles  de  precio,  color  y  tamano  semej  an¬ 
tes,  pero  de  marcas  diferentes.  Uno  de  los  automoviles  se 
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exhibio  con  una  modelo  femenina  a  50  de  los  hombres 
(grupo  A),  y  ambos  automoviles  se  exhibieron  sin  la 
modelo  a  los  otros  50  hombres  (grupo  B).  En  el  grupo  A, 
el  automovil  exhibido  con  la  modelo  fue  juzgado  como 
mas  costoso  por  37  hombres;  en  el  grupo  B,  el  mismo 
automovil  fue  considerado  como  el  mas  costoso  por  23 
hombres.  ^Estos  resultados  indican  que  usar  una  modelo 
femenina  influye  en  el  costo  percibido  de  un  automovil? 
Use  una  prueba  de  una  cola  con  a  =  .05. 

9.63  Tornillos  Muestras  aleatorias  de  200  tornillos 
fabricados  por  una  maquina  tipo  A  y  200  fabricados 
por  una  maquina  tipo  B,  mostraron  16  y  ocho  tornillos 
defectuosos,  respectivamente.  ^Estos  datos  presentan 
subciente  evidencia  para  sugerir  una  diferencia  en  la 
operation  de  los  tipos  de  maquina?  Use  a  =  .05. 

9.64  Siomasa  El  ejercicio  7.63  informo  que  la 
biomasa  para  bosques  tropicales,  considerada  como  de 
35  kilogramos  por  metro  cuadrado  (kg/m2),  puede  de 
hecho  ser  demasiado  alta  y  que  los  valores  de  biomasa 
tropical  vanan  de  una  region  a  otra,  de  unos  5  a  55  kg/m2.20 
Supongamos  que  usted  mide  la  biomasa  tropical  en  400 
lugares  de  un  metro  cuadrado,  seleccionados  al  azar 

y  obtiene  x  =  31.75  y  s  =  10.5.  ^Los  datos  presentan 
subciente  evidencia  para  indicar  que  los  cientfbcos  estan 
valorando  en  exceso  la  biomasa  media  para  bosques 
tropicales  y  que  la  media  es  de  hecho  mas  baja  de  lo 
estimado? 

a.  Indique  las  hipotesis  nula  y  alternativa  a  probar. 

b.  Localice  la  region  de  rechazo  para  la  prueba  con 
a  =  .01. 

c.  Realice  la  prueba  y  exprese  sus  conclusiones. 

9.65  Adolescentes  y  estres  social  En  un  estudio 
para  comparar  diferencias  etnicas  en  estres  social  en 
adolescentes,  unos  investigadores  reclutaron  personas  de 
tres  escuelas  de  ensenanza  media  en  Houston,  Texas.21 
El  estres  social  entre  cuatro  grupos  etnicos  se  midio 
usando  la  escala  llamada  Social  Attitudinal  Familial  and 
Environment  Scale  for  Children  (SAFE-C).  Ademas, 

se  recolecto  information  demograbca  acerca  de  los 
316  estudiantes  usando  cuestionarios  administrados 
por  si  mismos.  Una  tabulacion  de  respuestas  de 
estudiantes  a  una  pregunta  relacionada  con  su  condicion 
socioeconomica  (SES),  comparada  con  otras  familias  en 
las  que  los  estudiantes  escogieron  una  de  cinco  respuestas 
(mucho  peor,  un  poco  peor,  mas  o  menos  igual,  mejor  o 
mucho  mejor)  resulto  en  la  tabulacion  que  sigue. 

Euro-  Afroame-  De  origen  Deorigen 

americanos  ricanos  hispano  asiatico 

Tamano  muestral  144  66  77  19 

Mas  o  menos  igual  68  42  48  8 


a.  (-,Estos  datos  apoyan  la  hipotesis  de  que  la  proportion  de 
afroamericanos  adolescentes,  que  dicen  que  su  condicion 
socioeconomica  es  “mas  o  menos  igual”,  es  mejor  que  la 
de  adolescentes  estadounidenses  de  origen  hispano? 

b.  Encuentre  el  valor  p  para  la  prueba. 

c.  Si  usted  planea  probar  usando  a  =  .05,  /.cual  es  su 
conclusion? 

9.66*  Adolescentes  y  estres  social, 

continua  Consulte  el  ejercicio  9.65.  Debio  haberse 
pensado  en  disenar  una  prueba  para  la  cual  (3  es 
tolerablemente  baja  cuando  p,  excede  de  p2  en  una 
cantidad  importante.  Por  ejemplo,  encuentre  un  tamano 
muestral  comun  n  para  una  prueba  con  a  =  .05  y  [3  <  .20 
cuando  de  hecho  pl  excede  a  p2  en  0. 1 .  (sugerencia:  El 
valor  maximo  de  p(  I  —  p)  =  .25.) 

9.67  Bajar  de  peso  En  una  comparacion  de  la 
reduccion  media  de  peso  en  1  mes,  para  mujeres  de  20  a 
30  anos,  estos  datos  muestrales  se  obtuvieron  para  cada 


una  de  dos  dietas: 

Dieta  I  Dieta  II 

Tamano  muestral  n  40  40 

Media  muestral  x  101b  81b 

Variancia  muestral  s2  4.3  5.7 


(■,Los  datos  dan  subciente  evidencia  para  indicar  que  la 
dieta  I  produce  una  mayor  reduccion  media  de  peso  que 
la  dieta  II?  Use  a  =  .05. 

9.68  Mayor  production  A  un  agronomo  se  le 
demostro  experimentalmente  que  un  nuevo  regimen  de 
irrigacion/fertilizacion  produce  un  aumento  de  2  bushels 
por  cuadrado  (signibcante  al  nivel  de  1%),  cuando  se 
compara  con  el  regimen  por  ahora  en  uso.  El  costo  de 
poner  en  practica  y  usar  el  nuevo  regimen  no  sera  un 
factor  si  el  aumento  en  produccion  pasa  de  3  bushels  por 
cuadrado.  7,  La  signibcancia  estadfstica  es  igual  que  la 
importancia  practica  en  esta  situation?  Explique. 

9.69  Resistencia  de  cables  a  la  ruptura  Una 

prueba  de  las  resistencias  a  la  ruptura,  en  dos  tipos 
diferentes  de  cables,  fue  realizada  usando  muestras  de 
Mi  =  n2  =  100  trozos  de  cada  tipo  de  cable. 

Cable  I  Cable  II 

ir,  =  1925  \  =  1 905 

Si  =  40  s2  =  30 

(■,Los  datos  dan  subciente  evidencia  para  indicar  una 
diferencia  entre  la  resistencia  media  a  la  ruptura  de  los 
dos  cables?  Use  a  =  .05. 

9.70  Aplique  los  frenos  La  capacidad  de  frenado 
se  comparo  para  dos  modelos  de  automovil  del  2008. 
Muestras  aleatorias  de  64  automoviles  se  probaron 
para  cada  tipo.  La  medicion  registrada  fue  la  distancia 
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(en  pies)  necesaria  para  detenerse  cuando  se  aplicaron 
los  frenos  a  40  millas  por  hora.  Estas  son  las  medias  y 
variancias  muestrales  calculadas: 

Modelo  I  Modelo  II 

x,  =  1 1 8  \  =  1 09 

Si  =  102  s\  =  87 

7,  Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  entre  las  distancias  medias  de  parada  para  los 
dos  modelos? 

9.71  Aspersion  de  arboles  frutales  Unproductor 
de  frutas  desea  probar  una  nueva  fumigacion  que  un 
fabricante  dice  reducira  la  perdida  debida  a  insectos.  Para 
probar  lo  dicho,  el  productor  rocia  200  arboles  con  la 
nueva  fumigacion  y  otros  200  arboles  con  la  fumigacion 
estandar.  Se  registraron  los  siguientes  datos: 

Nueva  Fumigacion 

fumigacion  estandar 

Produccion  media  por  arbolx(lb)  240  227 

Varianza  s2  980  820 

a.  (',Los  datos  dan  suficiente  evidencia  para  concluir 
que  la  produccion  media  por  arbol  tratado  con  la 
nueva  fumigacion  es  mayor  que  la  de  arboles  tratados 
con  la  fumigacion  estandar?  a  =  .05. 

b.  Construya  un  intervalo  de  confianza  de  95%  para  la 
diferencia  entre  las  producciones  medias  para  las  dos 
fumigaciones. 

9.72  Actinomicina  D  Un  biologo  formula  la  hipotesis 
de  que  altas  concentraciones  de  actinomicina  D  inhiben 
la  sintesis  del  acido  ribonucleico  (RNA)  en  celulas  y,  en 
consecuencia,  la  produccion  de  proteinas.  Un  experimento 
realizado  para  probar  esta  teorfa  comparo  la  sintesis 

del  RNA  en  celulas  tratadas  con  dos  concentraciones  de 
actinomicina  D:  .6  y  .7  microgramos  por  mililitro. 

Las  celulas  tratadas  con  la  concentration  mas  baja  (.6)  de 
actinomicina  D  mostraron  que  55  de  entre  70  se 
desarrollaron  normalmente,  mientras  que  23  de  entre 
70  parecieron  desarrollarse  en  forma  normal  para  la 
concentration  mas  alta  (.7).  Estos  datos  dan  suficiente 
evidencia  para  indicar  una  diferencia  entre  los  porcentajes 
de  sintesis  normal  del  RNA  para  celulas  expuestas  a  las 
dos  diferentes  concentraciones  de  actinomicina  D? 

a.  Encuentre  el  valor  p  para  la  prueba. 

b.  Si  usted  planea  realizar  su  prueba  usando  a  =  .05, 

('  cuales  seran  las  conclusiones  de  su  prueba? 

9.73  Calificaciones  SAT  ^Como  se  comparan  los 
estudiantes  de  preparatoria  de  California  con  los  del  resto 
del  pais  en  aptitud,  medida  por  sus  calificaciones  del  SAT 
(examen  de  aptitud  escolar)?  El  promedio  national  de 
calificaciones  para  la  generation  de  2005  fueron  508  en 
expresion  verbal  y  520  en  matematicas.22  Suponga  que 


cien  estudiantes  de  California  de  la  generation  de  2005 
se  seleccionaron  al  azar  y  que  sus  calificaciones  del 
SAT  se  registraron  en  la  tabla  siguiente: 

Verbal  Matematicas 

Promedio  muestral  499  516 

Desviacion  estandar  muestral  98  96 

a.  t,Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  promedio  de  calificacion  verbal  para  todos  los 
estudiantes  de  California  de  la  generation  2005  es 
diferente  del  promedio  nacional?  Pruebe  usando  a  =  .05. 

b.  7,  Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  promedio  de  calificacion  de  matematicas  para  todos 
los  estudiantes  de  California  de  la  generation  2005  es 
diferente  del  promedio  nacional?  Pruebe  usando  a  =  .05. 

c.  <',Podna  usted  usar  estos  datos  para  determinar  si 
hay  diferencia  entre  el  promedio  de  calificaciones  de 
matematicas  y  verbal  para  todos  los  estudiantes  de 
California  de  la  generation  2005?  Explique  su  respuesta. 

9.74  Experimento  de  un  laberinto  En  un  estudio  de 
una  carrera  en  un  laberinto,  una  rata  corre  en  un  laberinto 
en  forma  de  T  y  se  registra  el  resultado  de  cada  carrera. 
Una  recompensa  en  forma  de  alimento  se  coloca  siempre 
en  la  salida  correcta.  Si  ocurre  un  aprendizaje,  la  rata 
escogera  la  salida  de  la  derecha  con  mas  frecuencia  que  la 
de  la  izquierda.  Si  no  hay  aprendizaje,  la  rata  debe  escoger 
al  azar  cualquiera  de  las  dos  salidas.  Suponga  que  a  la 
rata  se  le  dan  n  =  100  cameras  en  el  laberinto  y  que  ella 
escoge  la  salida  derecha  x  =  64  de  las  veces.  ^Concluirfa 
usted  que  tiene  lugar  un  aprendizaje?  Use  el  metodo  del 
valor  p  y  tome  una  decision  con  base  en  este  valor  p. 

9.75  Los  PCB  Se  han  encontrado  bifeniles  policlorados 
(PCB)  en  cantidades  peligrosamente  altas  en  algunas  aves 
de  caza  halladas  en  pantanos  de  la  costa  sudeste  de  Estados 
Unidos.  La  Administration  de  Alimentos  y  Drogas  (FDA) 
considera  que  una  concentration  de  los  PCB  de  mas 

de  5  partes  por  millon  (ppm)  en  estas  aves  de  caza  es 
peligrosa  para  consumo  humano.  Una  muestra  de  38 
aves  de  caza  produjo  un  promedio  de  7.2  ppm  con  una 
desviacion  estandar  de  6.2  ppm.  ^Hay  suficiente  evidencia 
para  indicar  que  las  ppm  medias  de  los  PCB  en  la 
poblacion  de  aves  de  caza  excede  del  limite  recomendado 
de  la  FDA  de  5  ppm?  Use  a  =  .01. 

9.76*  Los  PCB,  continua  Consulte  el  ejercicio  9.75. 

a.  Calcule  [3  y  1  —  /3  si  la  verdadera  media  de  ppm  de  los 
PCB  es  6  ppm. 

b.  Calcule  /3  y  1  —  /3  si  la  verdadera  media  de  ppm  de  los 
PCB  es  7  ppm. 

c.  Encuentre  la  potencia,  1  —  yS,  cuando  /x  =  8,  9,  10 
y  12.  Use  estos  valores  para  construir  una  curva  de 
potencia  para  la  prueba  del  ejercicio  9.75. 
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d.  (,  Para  que  valores  de  p  esta  prueba  tiene  potencia 
mayor  o  igual  a  .90? 

9.77  Conspiracion  del  9/11  Algunos 
estadounidenses  creen  que  toda  la  catastrofe  del  9/1 1 
fue  planeada  y  ejecutada  por  oficiales  federates  para  dar 
a  Estados  Unidos  un  pretexto  para  ir  a  la  guerra  en  el 
Medio  Oriente  y  como  medio  de  consolidar  y  ampliar  el 
poder  de  la  administration  vigente  en  ese  entonces.  Este 
grupo  de  estadounidenses  es  mayor  de  lo  que  se  cree. 

Una  encuesta  de  Scripps-Howard  de  n  =  1010  adultos  en 
agosto  de  2006  encontro  que  36%  de  los  estadounidenses 
considera  ese  escenario  muy  probable  o  algo  probable.23 
En  la  encuesta  siguiente,  una  muestra  aleatoria  de  n  = 
100  adultos  estadounidenses  encontro  que  26  de  los 
nruestreados  acordaron  que  la  teorfa  de  la  conspiracion 
era  probable  o  algo  probable.  (;Esta  muestra  contradice  la 
cifra  del  36%  publicada?  Pruebe  al  nivel  de  significancia 
de  a  =  .05. 

9.78  Estaturas  y  genero  Es  un  hecho  bien  aceptado 
que  los  hombres  son  mas  altos  en  promedio  que  las 
mujeres.  Pero,  ^cuanto  mas  altos?  Los  generos  de  105 
estudiantes  biomedicos  (ejercicio  1.54)  tambien  se 
registraron  y  los  datos  se  resumen  a  continuacion: 


Hombres  Mujeres 

Tamano  muestral  48  77 

Media  muestral  69.58  64.43 

Desviacion  estandar  muestral  2.62  2.58 


a.  Efectue  una  prueba  de  hipotesis  ya  sea  para  confirmar 
o  refutar  nuestro  dicho  inicial  de  que  los  hombres  son 
mas  altos  en  promedio  que  las  mujeres.  Use  a  =  .01. 

b.  Si  los  resultados  del  inciso  a)  muestran  que  nuestro 
dicho  era  correcto,  construya  un  limite  inferior 

de  una  cola  de  99%  de  confianza,  entre  estudiantes 
universitarios  hombres  y  mujeres.  ^Cuanto  mas  altos 
son  los  hombres  que  las  mujeres? 

9.79  Ingles  como  segundo  idioma  El  estado  de 
California  esta  trabajando  muy  duro  para  asegurarse 
que  todos  los  estudiantes  de  escuelas  elementales,  cuyo 


idioma  nativo  no  sea  el  ingles,  adquieran  suficiencia  en 
ingles  cuando  esten  en  el  sexto  grado.  Su  progreso  se 
vigila  cada  ano  usando  el  examen  de  desarrollo  del  ingles 
de  California.24  Los  resultados  de  dos  distritos  escolares 
del  sur  de  California  para  un  ano  escolar  reciente  se 
muestran  a  continuacion: 

Distrito  Riverside  Palm  Springs 

Numero  de  estudiantes  examinados  6124  5512 

Porcentaje  que  domina  el  ingles  40  37 

Estos  datos  dan  suficiente  evidencia  estadrstica  para 
indicar  que  el  porcentaje  de  estudiante  que  domina  el  ingles 
difiere  para  estos  dos  distritos?  Pruebe  usando  a  =  .01. 

9.80  Nadadores  de  estilo  de  pecho  7,Cuanto 
tiempo  de  entrenamiento  es  necesario  para  ser  nadador  de 
estilo  de  pecho  de  clase  nrundial?  Un  estudio  publicado 
en  The  American  Journal  de  Sports  Medicine  informo 
del  numero  de  metros  por  semana  nadados  por  dos 
grupos  de  nadadores,  los  que  compitieron  solo  en  estilo 
de  pecho  y  los  que  compitieron  en  combinado  individual 
(que  incluye  estilo  de  pecho).  El  numero  de  metros  por 
semana  practicando  el  nado  de  pecho  se  registro  y  las 
estadfsticas  en  resumen  se  muestran  a  continuacion.25 

Nado  de  pecho  Combinado  indiv. 


Tamano  muestral 

130 

80 

Media  muestral 

9017 

5853 

Desviacion  estandar  muestral 

7162 

1961 

7,  Hay  suficiente  evidencia  para  indicar  una  diferencia  en 
el  numero  promedio  de  metros  nadados  por  estos  dos 
grupos  de  nadadores?  Pruebe  usando  a  =  .01. 

9.81  Nado  de  pecho,  continua  Consulte  el 
ejercicio  9.80. 

a.  Construya  un  intervalo  de  confianza  de  99%  para  la 
diferencia  en  el  numero  promedio  de  metros  nadados 
en  estilo  de  pecho  contra  el  de  combinado  individual. 

b.  ('  Cuanto  mas  tiempo  practican  los  nadadores  del  estilo 
de  pecho  que  los  de  combinado?  6Cual  es  la  razon 
practica  para  esta  diferencia? 


APPLET 


9.82  Trabajadores  escolares  En  el  ejercicio 
8.109,  el  sueldo  promedio  por  hora  para  trabajadores  de 
cafeteria  de  escuela  publica  se  dio  como  $10. 33. 26  Si  se 
encuentra  que  n  =  40  trabajadores  de  cafeteria  de  escuela 
publica  seleccionados  dentro  de  un  distrito  escolar 
tienen  un  sueldo  promedio  por  hora  de  x  =  $9.75  con 


una  desviacion  estandar  de  s  =  $1.65,  ('  esta  information 
contradice  el  promedio  publicado  de  $10.33? 

a.  ('.Cuales  son  las  hipotesis  nula  y  alternativa  a  probar? 

b.  Use  el  applet  Large-Sample  test  of  a  Population 
Mean  para  hallar  el  valor  observado  del  estadfstico 
de  prueba. 
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c.  Use  el  applet  Large-Sample  test  of  a  Population 
Mean  para  hallar  el  valor  p  de  esta  prueba. 

d.  Con  base  en  sus  resultados  del  inciso  c),  ^que 
conclusiones  puede  sacar  acerca  del  sueldo  promedio 
por  hora  de  $10.33? 

9.83  Sueldos  por  dia  Los  sueldos  por  dfa  en  una 
industria  particular  estan  distribuidos  normalmente  con 
una  media  de  $94  y  una  desviacion  estandar  de  $1 1.88. 
Suponga  que  una  companfa  de  esta  industria  emplea  40 
trabajadores  y  les  paga  $91 .50  por  semana  en  promedio. 

Puede n  estos  trabajadores  ser  vistos  como  muestra 
aleatoria  de  entre  todos  los  trabajadores  de  la  industria? 

a.  ('  Cuales  son  las  hipotesis  nula  y  alternativa  a  probar? 

b.  Use  el  applet  Large-Sample  Test  of  a  Population 
Mean  para  hallar  el  valor  observado  de  la  estadfstica 
de  prueba. 

c.  Use  el  applet  Large-Sample  Test  of  a  Population 
Mean  para  hallar  el  valor  p  para  esta  prueba. 

d.  Si  usted  planed  realizar  su  prueba  utilizando  a  =  .01, 
('  cuales  serfan  las  conclusiones  de  su  prueba? 

e.  ^Fue  necesario  saber  que  los  sueldos  diarios  estan 
normalmente  distribuidos?  Explique  su  respuesta. 

9.84  Consulte  el  ejemplo  9.8.  Use  el  applet  Power  of  a 
Z-Test  para  verificar  la  potencia  de  la  prueba  de 

H0:  p  =  880  contra  //a:  p  A  880 


para  valores  de  p  iguales  a  870,  875,  880,  885  y  890. 
Compruebe  sus  respuestas  contra  los  valores  mostrados 
en  la  tabla  9.2. 

9.85  Consulte  el  ejemplo  9.8. 

a.  Use  el  metodo  dado  en  el  ejemplo  9.8  para  calcular  la 
potencia  de  la  prueba  de 

H0:  p  =  880  contra  Ha\  p  4=  880 
cuando  n  =  30  y  el  verdadero  valor  de  p  es  870 
toneladas. 

b.  Repita  el  inciso  a)  usando  n  =  70  y  p  =  870  toneladas. 

c.  Use  el  applet  Power  of  a  z-Test  para  verificar  sus 
resultados  hechos  manualmente  en  los  incisos  a)  y  b). 

d.  (jCual  es  el  efecto  de  aumentar  el  tamano  muestral 
sobre  la  potencia  de  la  prueba? 

9.86  Use  el  cursor  apropiado  en  el  applet  Power  of  a 
Z-Test  para  contestar  las  siguientes  preguntas.  Escriba 
una  oracion  para  cada  inciso,  describiendo  lo  que  vea 
usando  el  applet. 

a.  ^Que  efecto  tiene  aumentar  el  tamano  muestral  sobre 
la  potencia  de  la  prueba? 

b.  (,Que  efecto  tiene  aumentar  la  distancia  entre  el 
verdadero  valor  de  p  y  el  valor  hipotetico,  p  =  880, 
sobre  la  potencia  de  la  prueba? 

c.  ^Que  efecto  tiene  disminuir  el  nivel  de  significancia  a 
sobre  la  potencia  de  la  prueba? 


CASO 

prActico 


Una  aspirina  al  dia... 


7 


El  viernes  27  de  enero  de  1988,  la  portada  del  New  York  Times  decfa:  “Se  encuentra  que  el 
riesgo  de  un  ataque  al  corazon  se  reduce  al  tomar  aspirina:  se  ven  efectos  salvadores”.  Un 
estudio  muy  grande  de  medicos  de  Estados  Unidos  demostro  que  una  sola  aspirina  tomada 
un  dfa  sf  y  un  dfa  no  reduce  a  la  mitad  el  riesgo  de  ataque  cardiaco  en  hombres.27  Tres  dfas 
despues,  un  encabezado  en  el  Times  decfa,  “Valor  de  la  aspirina  diaria  discutido  en  un  estu¬ 
dio  ingles  de  ataques  al  corazon”.  ^Como  pueden  dos  estudios  aparentemente  similares, 
ambos  involucrando  a  doctores  como  participantes,  llegar  a  conclusiones  opuestas? 

El  estudio  de  los  medicos  estadounidenses  consistio  en  dos  pruebas  clfnicas  aleatorias 
en  una.  La  primera  probaba  la  hipotesis  de  que  325  miligramos  (mg)  de  aspirina  torna¬ 
dos  un  dfa  sf  y  uno  no  reduce  la  mortalidad  por  enfermedad  cardiovascular.  La  segunda 
probaba  si  50  mg  de  /3-caroteno  tomada  en  dfas  alternados  reduce  la  incidencia  de  can¬ 
cer.  De  los  nombres  en  una  cinta  de  computadora  de  la  Asociacion  Medica  Americana, 
261  248  medicos  hombres  de  entre  40  y  84  anos  de  edad  fueron  invitados  a  participar  en  la 
prueba.  De  quienes  respondieron,  59285  estuvieron  dispuestos  a  participar.  Despues  de 
la  exclusion  de  los  medicos  que  tenfa  una  historia  de  desordenes  clfnicos,  o  quienes  esta- 
ban  tomando  medicina  en  ese  tiempo  o  tenfan  reacciones  negativas  a  la  aspirina,  22  07 1 
medicos  fueron  seleccionados  al  azar  en  uno  de  cuatro  grupos  de  tratamiento:  1)  aspi¬ 
rina  y  /3-caroteno  regulados,  2)  aspirina  regulada  y  un  placebo  de  /3-caroteno,  3)  pla- 
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cebo  de  aspirina  y  /3-caroteno  y  4)  placebo  de  aspirina  y  placebo  de  /3-caroteno.  En  esta 
forma,  la  mitad  fueron  asignados  para  recibir  aspirina  y  la  mitad  a  recibir  /3-caroteno. 

El  estudio  fue  realizado  como  de  “doble  ciego”,  en  el  que  ninguno  de  los  participantes 
ni  los  investigadores  responsables  de  seguir  a  los  participantes  sabfa  a  cual  grupo  perte- 
necfa  un  participante.  Los  resultados  del  estudio  estadounidense  relacionado  con  infartos 
al  miocardio  (nombre  tecnico  de  ataques  al  corazon)  se  dan  en  la  tabla  siguiente: 

Estudio  estadounidense 
Aspirina  [n  =  1 1  037)  Placebo  [n  =  1 1  034) 

Infarto  al  miocardio 

Fatal  5  18 

No  fatal  99  171 

Total  104  189 

El  objetivo  del  estudio  ingles  era  determinar  si  500  mg  de  aspirina  tomada  diariamente 
reducirfa  la  incidencia  y  la  mortalidad  por  enfermedad  cardiovascular.  En  1978,  todos  los 
medicos  del  Reino  Unido  fueron  invitados  a  participar.  Despues  de  las  exclusiones  acos- 
tumbradas,  5139  medicos  se  asignaron  de  manera  aleatoria  para  tomar  aspirina,  a  menos 
que  surgiera  algun  problema  y  un  tercio  fueron  asignados  al  azar  para  evitar  la  aspirina. 
No  se  utilizaron  pastillas  de  placebo,  de  modo  que  el  estudio  no  era  ciego.  Los  resultados 
del  estudio  ingles  se  dan  aqui: 

Estudio  ingles 

Aspirina  [n  =  3429)  Control  (n=  1710) 

Infarto  al  miocardio 

Fatal  89  (47.3)  47  (49.6) 

No  fatal  80(42.5)  41(43.3) 

Total  169(89.8)  88(92.9) 

Para  compensar  los  numeros  desiguales,  el  estudio  ingles  publico  porcentajes  por  10  mil 
personas-ano  vivas  (dados  en  parentesis). 

1 .  Pruebe  si  el  estudio  estadounidense  indica  en  efecto  que  el  porcentaje  de  ataques  al 
corazon,  para  medicos  que  toman  325  mg  de  aspirina  un  dfa  sf  y  uno  no,  es  significati- 
vamente  diferente  del  porcentaje  de  los  de  placebo.  ^Se  justifica  lo  dicho  por  el  estudio 
estadounidense? 

2.  Repita  el  analisis  usando  los  datos  del  estudio  ingles  en  el  que  un  grupo  tomo  500  mg 
de  aspirina  al  dfa  y  el  grupo  de  control  que  no  tomo  nada.  Con  base  en  sus  datos,  ^se 
justifica  lo  dicho  por  el  estudio  ingles? 

3.  (',Puede  usted  considerar  algunas  razones  posibles  por  las  que  los  resultados  de  estos 
dos  estudios,  que  fueron  semejantes  en  algunos  aspectos,  produjeran  conclusiones  tan 
distintas? 
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OBJETIVOS  GENERALES _ 

Los  conceptos  basicos  de  estimacion  estadistica  de 
muestra  grande  y  prueba  de  hipotesis,  para  situaciones 
practicas  que  involucran  medias  y  proporciones  pobla- 
cionales,  se  introdujeron  en  los  capitulos  8  y  9.  Como 
todas  estas  tecnicas  se  apoyan  en  el  teorema  del  limite 
central  para  justificar  la  normalidad  de  los  estimadores  y 
estadisticas  de  prueba,  aplican  solo  cuando  las  muestras 
son  grandes.  Este  capltulo  complementa  las  tecnicas 
de  muestra  grande  al  presentar  pruebas  de  muestra 
pequena  e  intervalos  de  confianza  para  medias  y  varianzas 
poblacionales.  A  diferencia  de  sus  similares  de  muestras 
grandes,  estas  tecnicas  de  muestra  pequena  requieren 
que  las  poblaciones  muestreadas  sean  normales  o  que 
aproximadamente  lo  sean. 

jNDICE  DEL  CAPITULO 

Comparacion  de  dos  varianzas  poblacionales  (10.7) 
Inferencias  respecto  a  varianza  poblacional  (10.6) 
Prueba  de  diferencia  pareada:  muestras  dependientes 
(10.5) 

Suposiciones  de  muestra  pequena  (10.8) 

Inferencias  de  muestra  pequena  respecto  a  la  diferen¬ 
cia  en  dos  medias:  muestras  aleatorias  independien- 
tes  (10.4) 

Inferencias  de  muestra  pequena  respecto  a  una  media 
poblacional  (10.3) 

Distribucion  f  de  Student  (10.2) 


M)  £Le  gustaria  una  semana 
de  cuatro  dias  de  trabajo? 

yUn  horario  flexible  de  semana  de  trabajo  re- 
sulta  en  beneficios  positivos  para  empleador  y 
empleado?  Cuatro  beneficios  obvios  son  (1)  me- 
nos  tiempo  de  viaje  de  posiciones  de  campo  a  la 
oficina,  (2)  menos  empleados  estacionados  en  el 
estacionamiento,  (3)  reducidos  gastos  de  viaje  y 
(4)  permiso  a  empleados  para  tener  otro  dia  fibre. 
Pero,  yla  semana  de  trabajo  flexible  hace  que  los 
empleados  sean  mas  eficientes  y  les  hace  tomar 
menos  dias  por  enfermedad  o  motivos  persona- 
les?  Las  respuestas  a  algunas  de  estas  preguntas 
se  plantean  en  el  caso  practico  al  final  de  este  ca- 
pitulo. 


ENTRENADOR  PERSONAL 


£Como  decido  cual  prueba  usar? 
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INTRODUCCION 

Supongamos  que  usted  necesita  correr  un  experimento  para  estimar  una  media  pobla- 
cional  o  la  diferencia  entre  dos  medias.  El  proceso  de  recolectar  los  datos  puede  ser  muy 
costoso  o  lento.  Si  no  se  puede  recolectar  una  muestra  grande,  los  procedimientos  de 
estimacion  y  prueba  de  los  capitulos  8  y  9  no  sirven. 

Este  capitulo  introduce  algunos  procedimientos  estadisticos  equivalentes  que  se  pue- 
den  usar  cuando  el  tamaho  muestral  es  pequeilo.  Los  procedimientos  de  estimacion  y 
prueba  comprenden  estos  parametros  ya  conocidos: 


•  Una  sola  media  poblacional,  p 

•  La  diferencia  entre  dos  medias  poblacionales,  (p{  —  p2) 

•  Una  sola  varianza  poblacional,  a2 

•  La  comparacion  de  dos  varianzas  poblacionales,  cr2  y  a22 


Las  pruebas  e  intervalos  de  confianza  de  muestra  pequena  para  proporciones  binomiales 
se  omitiran  para  nuestro  analisis.' 


DISTRIBUCION  t  DE  STUDENT 

A1  efectuar  un  experimento  para  evaluar  un  proceso  nuevo  pero  muy  costoso  para 
producir  diamantes  sinteticos,  usted  puede  estudiar  solo  seis  diamantes  generados  por 
el  proceso.  ^Como  puede  usar  estas  seis  mediciones  para  hacer  inferencias  acerca  del 
peso  promedio  p  de  diamantes  a  partir  de  este  proceso? 

A1  estudiar  la  distribucion  muestral  de  x  en  el  capitulo  7,  hicimos  estos  puntos: 


•  Cuando  la  poblacion  original  muestreada  sea  normal,  xy  z  =  (x  —  p)/(a/Vn) 
tienen  distribuciones  normales,  para  cualquier  tamano  muestral. 

•  Cuando  la  poblacion  muestreada  no  sea  normal,  x,  z  =  (x  —  p)l(al\/Ti),  y  z~ 
(x  —  p)l(<rl\ni )  tienen  distribuciones  aproximadamente  iguales,  si  el  tamano 
muestral  es  grande. 


CONSEJO 


Cuando  n  <  30,  el  teorema 
del  limite  central  no  garantiza 
que 
x  -  n 
s/Vn 


sea  aproximadamente  normal. 


Desafortunadamente,  cuando  el  tamano  muestral  n  sea  pequeno,  el  estadistico  (x  —  /x)/ 
(s/Vn)  no  tiene  una  distribucion  normal.  Por  tanto,  todos  los  valores  criticos  de  z  que 
utilizamos  en  los  capitulos  8  y  9  ya  no  son  correctos.  Por  ejemplo,  no  se  puede  decir 
que  x  se  encontrara  a  no  mas  de  1.96  errores  estandar  de  p  95%  del  tiempo. 

Este  problema  no  es  nuevo;  fue  estudiado  por  expertos  en  estadistica  y  experimen- 
tadores  a  principios  del  siglo  xx.  Para  hallar  la  distribucion  muestral  de  esta  estadistica, 
hay  dos  formas  de  proceder: 

•  Use  un  metodo  empirico.  Saque  repetidas  muestras  y  calcule  (x  —  pjMs/'v'n) 
para  cada  muestra.  La  distribucion  relativa  de  frecuencia  que  usted  construya 
usando  estos  valores  aproximaran  la  forma  y  ubicacion  de  la  distribucion 
muestral. 

•  Use  un  metodo  matematico  para  deducir  la  funcion  real  de  densidad  o  curva  que 
describa  la  distribucion  muestral. 


t 


Una  prueba  de  muestra  pequena  para  el  parametro  binomial  p  se  presentara  en  el  capitulo  15. 
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Este  segundo  metodo  fue  utilizado  por  un  ingles  llamado  W.S.  Gosset  en  1908.  El  dedujo 
una  complicada  formula  para  la  funcion  de  densidad  de 

_  x  — 
s/Vn 

para  muestras  aleatorias  de  tamano  n  desde  una  poblacion  normal  y  publico  sus  resul- 
tados  bajo  el  nombre  de  “Student”.  Desde  entonces,  la  estadfstica  se  conoce  como  t  de 
Student.  Tiene  las  siguientes  caracterfsticas: 

•  Tiene  forma  de  montfculo  y  es  simetrica  alrededor  de  t  =  0,  igual  que  z. 

•  Es  mas  variable  que  z,  con  “colas  mas  pesadas”;  esto  es,  la  curva  t  no  aproxima  al 
eje  horizontal  con  la  misma  rapidez  que  z.  Esto  es  porque  el  estadfstico  t  abarca 
dos  cantidades  aleatorias,  x  y  s,  en  tanto  que  el  estadfstico  z  tiene  solo  la  media 
muestral,  x.  Se  puede  ver  este  fenomeno  en  la  figura  10.1. 

•  La  forma  de  la  distribucion  t  depende  del  tamano  muestral  n.  A  medida  que  n  au- 
menta,  la  variabilidad  de  t  disminuye  porque  la  estimacion  s  de  a  esta  basada  en 
mas  y  mas  informacion.  En  ultima  instancia,  cuando  n  sea  infinitamente  grande, 
las  distribuciones  tyz  son  identicas. 


Para  una  fde  una  muestra, 

df=n-  1. 


El  divisor  (n  —  1)  en  la  formula  para  la  varianza  muestral  s2  se  denomina  numero  de 
grados  de  libertad  (df)  asociados  con  s2.  Determina  la  forma  de  la  distribucion  t.  El 
origen  del  termino  grados  de  libertad  es  teorico  y  se  refiere  al  numero  de  desviaciones 
independientes  elevadas  al  cuadrado  en  s2  existentes  para  estimar  a2.  Estos  grados  de 
libertad  pueden  cambiar  para  diferentes  aplicaciones  y,  como  especifican  la  distribucion 
t  correcta  a  usar,  es  necesario  recordar  que  hay  que  calcular  los  grados  de  libertad  correc- 
tos  para  cada  aplicacion. 

La  tabla  de  probabilidades  para  la  distribucion  z  normal  estandar  ya  no  es  util  para 
calcular  valores  crfticos  o  valores  p  para  el  estadfstico  p.  En  lugar  de  ello,  se  usara  la 
tabla  4  del  apendice  I  que  se  reproduce  parcialmente  en  la  tabla  10.1.  Al  indizar  un 
numero  particular  de  grados  de  libertad,  la  tabla  registra  ta,  un  valor  de  t  que  tiene  area 
a  de  cola  a  su  derecha,  como  se  ve  en  la  figura  10.2. 


FIGURA  10.2 

Valores  tabulados  de  la  f 
de  Student 
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tabla  10.1  Formato  de  la  tabla  t  de  Student  tornado  de  la  tabla  4  del  apendice  I 


df 

t.m 

t()50 

^025 

t.m 

1 005 

df 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

1 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

2 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

3 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

4 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

5 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

6 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

7 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

8 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

9 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

26 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

27 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

28 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

29 

inf. 

1.282 

1.645 

1.960 

2.326 

2.576 

inf. 

Para  una  distribucion  t  con  5  grados  de  libertad,  el  valor  de  t  que  tiene  area  .05  a  su 
derecha  se  encuentra  en  la  fila  5  en  la  columna  marcada  r050.  Para  esta  distribucion  t 
particular,  el  area  a  la  derecha  de  t  =  2.015  es  .05;  solo  5%  de  todos  los  valores  de  la 
estadistica  t  rebasaran  este  valor. 


Se  puede  usar  el  applet  Student’s  t  Probabilities  (Probabilidades  t  de  Student) 

para  hallar  el  valor  t  descrito  en  el  ejemplo  10.1.  El  primer  applet,  que  aparece  en  la 
figura  10.3,  da  valores  t  y  sus  probabilidades  de  dos  colas,  en  tanto  que  el  segundo 
applet  da  valores  t  y  probabilidades  de  una  cola.  Use  el  cursor  de  la  derecha  del  applet 
para  seleccionar  los  grados  de  libertad  apropiados.  Para  el  ejemplo  10.1,  debe  selec- 
cionar  df  =  5  y  teclear  .10  en  la  caja  marcada  “prob:”  en  la  parte  inferior  del  primer 
applet.  El  applet  dara  el  valor  de  t  que  ponga  .05  en  una  cola  de  la  distribucion  t.  El 
segundo  applet  mostrara  la  t  identica  para  un  area  de  .05  de  una  cola.  El  applet  de  la 
figura  10.3  muestra  t  =  2.02  que  es  correcta  a  dos  lugares  decimales.  Usaremos  este 
applet  para  los  ejercicios  de  Mi  Applet  al  final  del  capitulo. 


FIGURA  10.3 

Applet  Student's  f 
Probabilities 
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FIGURA  10.4 

Distribucion  f  para  el 
ejemplo  10.2 


Supongamos  que  usted  tiene  una  muestra  de  tamano  n  =  10  de  una  distribucion  normal. 
Encuentre  un  valor  de  t  tal  que  solo  1  %  de  todos  los  valores  de  t  sea  mas  pequeno. 

Solucion  Los  grados  de  libertad  que  especifican  la  distribucion  t  correcta  son 
df  =  n  —  1  =  9,  y  el  valor  t  necesario  debe  estar  en  la  parte  inferior  de  la  distribucion, 
con  area  .01  a  su  izquierda,  como  se  ve  en  la  figura  10.4.  Como  la  distribucion  t  es 
simetrica  alrededor  de  0,  este  valor  es  simplemente  el  negativo  del  valor  en  el  lado 
derecho  con  area  .01  a  su  derecha,  o  -tm  =  —2.821. 


m 


FIGURA  10.5 


Applet  Comparing  f  and  z 


APPLET 

Comparacion  de  las  distribuciones  t  y  z 

Vea  una  de  las  columnas  de  la  tabla  10.1.  Cuando  aumentan  los  grados  de  libertad, 
el  valor  critico  de  t  disminuye  hasta  que,  con  df  =  inf.,  el  valor  t  critico  es  igual  al 
valor  z  critico  para  la  misma  area  de  cola.  Se  puede  usar  el  applet  (Comparing  t  and  z) 
para  visualizar  este  concepto.  Vea  los  tres  applets  de  la  figura  10.5,  que  muestran  los 
valores  crfticos  para  ta 25  en  comparacion  con  z.ms  para  df  =  8  29  y  100.  (El  cursor  del 
lado  derecho  del  applet  permite  cambiar  el  df.)  La  curva  roja  (negra  en  la  figura  10.5) 
es  la  distribucion  normal  estandar,  con  z.ms  =  1-96. 


d 


-4^0  ^0*^2 .0  -1.0  0.0  1.0  2.0  3.0  4.0  — I 

d 


-4.0  -3.0  -2.0  -1.0  0.0  1.0  2.0  3.0  4.0 

-2.05  2.05  i 

-1.96  1.96  z 
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La  curva  azul  es  la  distribution  t.  Con  8  grados  de  libertad,  claramente  se  puede 
ver  una  diferencia  en  las  curvas  t  y  z,  en  especial  en  los  valores  criticos  que  cortan  un 
area  de  .025  en  las  colas.  Cuando  aumentan  los  grados  de  libertad,  la  diferencia  en  las 
formas  de  t  y  z  se  hace  muy  similar,  al  igual  que  sus  valores  criticos,  hasta  que  en  df = 
100  casi  no  hay  diferencia.  Esto  ayuda  a  exp  hear  por  que  usamos  n  =  30  como  linea 
divisoria  un  tanto  arbitraria  entre  muestras  grandes  y  pequenas.  Cuando  n  =  30  (elf  = 
29),  los  valores  criticos  de  t  son  bastante  cercanos  a  sus  similares  normales.  Mas  que 
producir  una  tabla  t  con  bias  para  muchos  mas  grados  de  libertad,  los  valores  criticos 
de  z  son  subcientes  cuando  el  tamano  muestral  llega  a  n  =  30. 


CONSEJO 


Suposiciones  para  t  de  una 
muestra: 


•  Muestra  aleatoria 


•  Distribucion  normal 


Suposiciones  tras  la  distribucion 
t  de  Student 

Los  valores  criticos  de  t  permiten  hacer  inferencias  confiables  solo  si  el  experimentador 
sigue  todas  las  reglas;  esto  es,  su  muestra  debe  satisfacer  estos  requisitos  especificados 
por  la  distribucion  t: 

•  La  muestra  debe  ser  seleccionada  al  azar. 

•  La  poblacion  de  la  que  haga  muestreo  debe  estar  normalmente  distribuida. 

Estos  requisitos  pueden  parecer  bastante  restrictivos.  ^Como  puede  posiblemente  saberse 
la  forma  de  la  distribucion  de  probabilidad  para  toda  la  poblacion  si  solo  se  tiene  una 
muestra?  Pero,  si  este  fuera  un  problema  serio,  el  estadistico  t  podrfa  usarse  en  solo  situa- 
ciones  muy  limitadas.  Por  fortuna,  la  forma  de  la  distribucion  t  no  es  afectada  en  mucho 
mientras  la  poblacion  muestreada  tenga  una  distribucion  aproximadamente  en  forma  de 
monticulo.  Los  estadisticos  dicen  que  el  estadistico  t  es  robusto,  lo  cual  significa  que  la 
distribucion  de  la  estadistica  no  cambia  de  manera  significativa  cuando  se  viola  la  supo- 
sicion  de  normalidad. 

^Cdmo  se  puede  saber  si  la  muestra  es  de  una  poblacion  normal?  Aun  cuando  hay 
procedimientos  estadisticos  disenados  para  este  fin,  la  forma  mas  facil  y  rapida  de  veri- 
ficar  la  normalidad  es  usar  las  tecnicas  graficas  del  capitulo  2:  Trazar  una  grafica  de 
puntos  o  construir  una  grafica  de  tallo  y  hoja.  Mientras  esta  grafica  tienda  a  “hacerse 
monticulo”  en  el  centro,  se  puede  estar  razonablemente  seguro  al  usar  la  estadistica  t 
para  hacer  inferencias. 

El  requisite  de  muestreo  aleatorio,  por  otra  parte,  es  bastante  critico  si  se  desea  pro¬ 
ducir  inferencias  confiables.  Si  la  muestra  no  es  aleatoria,  o  si  no  se  comporta  al  menos 
como  muestra  aleatoria,  entonces  los  resultados  de  su  muestra  pueden  ser  afectados  por 
algun  factor  desconocido  y  las  conclusiones  pueden  ser  incorrectas.  Cuando  disene  un 
experimento  o  lea  acerca  de  experimentos  realizados  por  otros  investigadores,  vea  de 
manera  crftica  la  forma  en  que  los  datos  han  sido  recolectados. 


INFERENCIAS  DE  MUESTRA  PEQUENA 
RESPECTO  A  UNA  MEDIA  POBLACIONAL 

Al  igual  que  con  una  inferencia  de  muestra  grande,  una  inferencia  de  muestra  pequena 
puede  comprender  ya  sea  estimation  o  prueba  de  hipotesis,  dependiendo  de  la  pre- 
ferencia  del  experimentador.  En  capitulos  previos  explicamos  los  aspectos  basicos  de 
estos  dos  tipos  de  inferencia  y  los  usamos  de  nuevo  ahora  con  una  estadistica  muestral 
diferente,  t  =  (fx  —  pl)/(s/Vn ),  y  una  distribucion  de  muestreo  diferente,  la  t  de  Student, 
con  (n  —  1)  grados  de  libertad. 


www.FreeLibros.me 


392  O  CAPiTULO  10  INFERENCE  A  PARTIR  DE  MUESTRAS  PEQUENAS 


E  J  E  M  P  L 


PRUEBA  DE  HIPOTESIS  DE  MUESTRA  PEQUENA  PARA  ,x 

1 .  Hipotesis  nula:  H0 :  fx  =  p,0 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

:  ix  >  no  Ha  :  fx=f=  ii0 

(o,  H,  :  fx  <  ix 0) 

3.  Estadistico  de  prueba:  t  =  — —  — 

s/Vn 

4.  Region  de  rechazo:  rechazar  H0  cuando 


Prueba  de  una  cola  Prueba  de  dos  colas 

t>  ta  t  >  ta/2  o  t  <  -ta/2 

(o  t  <  —  ta  cuando  la 
hipotesis  alternativa 
es  Ha:  fx<  p „ ) 


o  cuando  el  valor  p  <  a 


Los  valores  criticos  de  t,  ta  y  t„l2  estan  basados  en  (n  —  1 )  grados  de  libertad.  Estos  valo- 
res  tabulados  se  pueden  hallar  usando  la  tabla  4  del  apendice  I  o  el  applet  Student’s  t 
Probabilities. 

Suposicion:  La  muestra  se  selecciona  al  azar  de  una  poblacion  normalmente  dis- 
tribuida. 


INTERVALO  DE  CONFIANZA  DE  MUESTRA  PEQUENA 
(1  -  a)  100%  PARA  (x 

X  ±  t„/2-4= 

Vn 

donde  s/Vn  es  el  error  estandar  estimado  de  x,  a  veces  conocido  como  error  estan- 
dar  de  la  media. 


Un  nuevo  proceso  para  producir  diamantes  sinteticos  puede  ser  operado  a  un  nivel  renta¬ 
ble  solo  si  el  peso  promedio  de  estos  es  mayor  a  .5  quilates.  Para  evaluar  la  rentabilidad 
del  proceso,  se  generan  seis  diamantes  que  registran  pesos  de  .46,  .61,  .52,  .48,  .57  y  .54 
quilates.  ^Estas  seis  mediciones  presentan  suficiente  evidencia  para  indicar  que  el  peso 
promedio  de  los  diamantes  producidos  por  el  proceso  es  mas  de  .5  quilates? 


Solucion  La  poblacion  de  pesos  de  diamantes  producidos  por  este  nuevo  proceso 
tiene  media  /x,  y  se  puede  empezar  la  prueba  formal  de  hipotesis  en  pasos,  como  se  hizo 
en  el  capitulo  9: 
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1-2  Hipotesis  nula  y  alternativa: 

Hq.  p  =  .5  contra  //a:  p>  .5 

3  Estadistico  de  prueba:  Usted  puede  usar  su  calculadora  para  verificar  que  la  media 
y  desviacion  estandar  para  los  pesos  de  los  seis  diamantes  son  .53  y  .0559,  respectiva- 
mente.  El  estadistico  de  prueba  es  un  estadistico  t,  calculado  como 


4 


5 


t  =  x~  ^  =  -53  ^  .5 
M  .0559/V6 


1.32 


A1  igual  que  con  las  pruebas  de  muestra  grande,  el  estadistico  de  prueba  da  evidencia 
para  rechazar  o  aceptar  H0  dependiendo  de  que  tan  lejos  se  encuentra  del  centra  de  la 
distribucion  t. 


Region  de  rechazo:  Si  se  escoge  un  nivel  de  significancia  de  5%  (a  =  .05),  la  region 
de  rechazo  de  cola  derecha  se  encuentra  usando  los  valores  crfticos  de  t  de  la  tabla  4  del 
apendice  I.  Con  df  =  n  —  1  =  5,  se  puede  rechazar  H0  si  t  >  t05  =  2.015,  como  se  ve  en 
la  figura  10.6. 

Conclusion:  Como  el  valor  calculado  del  estadistico  de  prueba,  1.32,  no  cae  en  la 
region  de  rechazo,  no  se  puede  rechazar  H0.  Los  datos  no  presentan  suficiente  evidencia 
para  indicar  que  el  peso  medio  de  los  diamantes  exceda  de  .5  quilates. 


FIGURA  10.6 

Region  de  rechazo  para  el 
ejemplo  10.3 


CONSEJO 


Un  intervalo  de  confianza 
de  95%  nos  dice  que,  si 
fueramos  a  construir  muchos 
de  estos  intervalos  (todos 
los  cuales  tendrian  puntos 
extremos  ligeramente 
diferentes),  95%  de  ellos 
rodearian  a  la  media 
poblacional. 


A1  igual  que  en  el  capitulo  9,  la  conclusion  para  aceptar  H0  requerirfa  el  dificil  calculo 
de  (3,  la  probabilidad  de  un  error  tipo  IE  Para  evitar  este  problema,  escogemos  no  recha¬ 
zar  H0.  Podemos  entonces  calcular  el  limite  inferior  para  p  usando  un  limite  inferior  de 
confianza  de  un  lado  y  muestra  pequena.  Este  limite  es  similar  al  limite  de  confianza 
de  un  lado  y  muestra  grande,  excepto  que  la  za  critica  es  sustituida  por  una  ta  critica  de  la 
tabla  4.  Para  este  ejemplo,  un  limite  inferior  de  confianza  de  un  lado  para  p  es: 


x 


.53  -  2.015^59 

V6 


.53  -  .046 


El  limite  inferior  de  95%  para  pes  p>  .484.  El  rango  de  posibles  valores  incluye  pesos 
medios  de  diamantes  tanto  menores  como  may  ores  a  .5;  esto  confirma  el  fracaso  de 
nuestra  prueba  para  demostrar  que  p  excede  de  .5. 
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Recuerde  del  capftulo  9  que  hay  dos  formas  de  efectuar  una  prueba  de  hipotesis: 

•  El  metodo  del  valor  critico:  Proponga  una  region  de  rechazo  basada  en  los 
valores  criticos  de  la  distribucion  muestral  de  la  estadfstica.  Si  el  estadistico  de 
prueba  cae  en  la  region  de  rechazo,  se  puede  rechazar  H0. 

•  El  metodo  del  valor  p:  Calcule  el  valor  p  con  base  en  el  valor  observado  de  la 
estadfstica  de  prueba.  Si  el  valor  p  es  menor  que  el  nivel  de  signihcancia,  a,  se 
puede  rechazar  H0.  Si  no  hay  nivel  de  significancia  preestablecido,  use  las  gufas  de 
la  section  9.3  para  juzgar  la  significancia  estadfstica  de  sus  resultados  muestrales. 


Usamos  el  primer  metodo  en  la  solucion  del  ejemplo  10.3  y  el  segundo  metodo  para 
resolver  el  ejemplo  10.4. 

Las  leyendas  en  latas  de  1  galon  de  pintura  por  lo  general  indican  el  tiempo  de  secado  y 
el  area  que  puede  cubrirse  con  una  capa.  Casi  todas  las  marcas  de  pintura  indican  que,  en 
una  capa,  1  galon  cubrira  entre  250  y  500  pies  cuadrados,  dependiendo  de  la  textura  de  la 
superficie  a  pintarse.  Un  fabricante,  sin  embargo,  dice  que  1  galon  de  su  pintura  cubrira 
400  pies  cuadrados  de  area  superficial.  Para  probar  su  dicho,  una  muestra  aleatoria  de 
10  latas  de  1  galon  de  pintura  blanca  se  empleo  para  pintar  10  areas  identicas  usando 
la  misma  clase  de  equipo.  Las  areas  reales  (en  pies  cuadrados)  cubiertas  por  estos  10 
galones  de  pintura  se  dan  a  continuation: 


310  311  412  368  447 

376  303  410  365  350 


/Los  datos  presentan  suficiente  evidencia  para  indicar  que  la  cobertura  promedio  difiere 
de  400  pies  cuadrados?  Encuentre  el  valor  p  para  la  prueba  y  uselo  para  evaluar  la  signi¬ 
ficancia  estadfstica  de  los  resultados. 


CONSEJO 


Recuerde  del  capftulo  2 
como  calcular  x  y  s  usando  el 
metodo  de  entrada  de  datos 
en  su  calculadora. 


Solucion  Para  probar  el  dicho,  las  hipotesis  a  probarse  son 
H0 :  p,  =  400  contra  Ha :  p.  #  400 
La  media  muestral  y  desviacion  estandar  para  los  datos  registrados  son 
x  =  365.2  v  =  48.417 


y  el  estadistico  de  prueba  es 

=  *  Z  =  365.2  -  400  =  _9  97 
slVTi  48.417/VTo 

El  valor  p  para  esta  prueba  es  la  probabilidad  de  observar  un  valor  de  la  estadfstica  t 
como  contradictorio  a  la  hipotesis  nula  como  el  observado  para  este  conjunto  de  datos, 
es  decir,  t  =  —2.27.  Como  esta  es  una  prueba  de  dos  colas,  el  valor  p  es  la  probabilidad 
de  que  t  <  —2.27  ot>  2.27. 

A  diferencia  de  la  tabla  z,  la  tabla  para  t  da  los  valores  de  t  correspondientes  a  areas 
de  cola  superior  iguales  a  .100,  .050,  .025,  .010  y  .005.  En  consecuencia,  solo  se  puede 
aproximar  el  area  de  cola  superior  que  corresponda  a  la  probabilidad  de  que  t  >  2.27 . 
Como  el  estadistico  t  para  esta  prueba  esta  basada  en  9  df  nos  referimos  a  la  fila  corres- 
pondiente  a  df  =  9  de  la  tabla  4.  Los  cinco  valores  criticos  para  varias  areas  de  cola  se 
muestran  en  la  figura  10.7,  un  agrandamiento  de  la  cola  de  la  distribucion  t  con  9  grados 
de  libertad.  El  valor  t  =  2.27  cae  entre  t0 25  =  2.262  y  tmo  =  2.821.  Por  tanto,  el  area  de 
cola  derecha  correspondiente  a  la  probabilidad  de  que  t  >  2.27  esta  entre  .01  y  .025. 
Como  esta  area  representa  solo  la  mitad  del  valor  p,  se  puede  escribir 

.01  <  —(valor  p)  <  .025  o  .02  <  valor  p  <  .05 
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FIGURA  10.7 


1.383  1.833 


2.821  3.250 


2.27 


Calculo  del  valor  p  para 
el  ejemplo  10.4  (area 
sombreada  =  \  valor  p) 


^Que  nos  dice  esto  acerca  de  la  significancia  de  los  resultados  estadisticos?  Para  recha- 
zar  H0,  el  valor  p  debe  ser  menor  al  nivel  de  significancia  especificado,  a.  En  consecuen- 
cia,  podrfa  rechazarse  H0  al  nivel  de  5%  pero  no  al  nivel  de  2%  o  1%.  Por  tanto,  el  valor 
p  para  esta  prueba  por  lo  general  serfa  informado  por  el  experimentador  como 

valor  p  <  .05  (o  a  veces  P  <  .05) 

Para  esta  prueba  de  hipotesis,  H0  es  rechazada  al  nivel  de  significancia  de  5%.  Hay  sufi- 
ciente  evidencia  para  indicar  que  la  cobertura  promedio  difiere  de  400  pies  cuadrados. 

Dent ro  de  que  limites  realmente  cae  este  promedio  de  cobertura?  Un  intervalo 
de  confianza  de  95%  da  los  limites  superior  e  inferior  para  p.  como 


365.2  ±  34.63 


Entonces,  se  puede  estimar  que  el  promedio  de  area  cubierta  por  1  galon  de  esta  marca 
de  pintura  esta  en  el  intervalo  330.6  a  399.8.  Una  estimacion  mas  precisa  del  intervalo 
(un  intervalo  mas  corto)  puede  obtenerse  por  lo  general  al  aumentar  el  tamano  muestral. 
Observe  que  el  limite  superior  de  este  intervalo  es  muy  cercano  al  valor  de  400  pies 
cuadrados,  que  es  la  cobertura  marcada  en  la  leyenda  de  la  lata.  Esto  coincide  con  el 
hecho  de  que  el  valor  observado  de  t  =  —2.27  es  solo  ligeramente  menor  que  el  valor 
critico  de  cola  izquierda  de  f0 25  =  —2.262,  haciendo  que  el  valor  p  sea  solo  ligeramente 
menor  a  .05. 


Casi  todos  los  paquetes  de  estadistica  para  computadoras  contienen  programas  que 
ponen  en  practica  la  prueba  t  de  Student  o  construyen  un  intervalo  de  confianza  para  p 
cuando  los  datos  se  introducen  correctamente  en  la  base  de  datos  de  la  computadora. 
Casi  todos  estos  programas  calcularan  e  indicaran  el  valor  p  exacto  de  la  prueba,  lo 
cual  permite  en  forma  rapida  y  precisa  sacar  conclusiones  acerca  de  la  significancia 
estadistica  de  los  resultados.  Los  resultados  del  MINITAB  de  prueba  t  de  una  muestra  y 
de  procedimientos  de  intervalo  de  confianza  se  dan  en  la  figura  10.8.  Ademas  del  valor 
observado  de  t  =  —2.27  y  el  intervalo  de  confianza  (330.6,  399.8),  la  salida  da  la  media 
muestral,  la  desviacion  muestral  estandar,  el  error  estandar  la  media  (media  de  error 
estandar  =  s/Vti),  y  el  valor  p  exacto  de  la  prueba  (P  =  .049).  Esto  es  consistente  con  el 
rango  para  el  valor  p  que  encontramos  usando  la  tabla  4  del  apendice  I: 

.02  <  valor  p  <  .05 


Calculo  del  valor  p  para 
el  ejemplo  10.4  (area 
sombreada  =  \  valor  p) 
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FIGURA  10.8 

Salida  impresa  MINITAB  T  de  una  muestra:  Area 


para  el  ejemplo  10.4 

Test  of  mu 

Variable 

=400  vs 

N 

not  =  400 

Mean 

StDev 

SE  Mean 

Area 

10 

365.2 

48.4 

15.3 

Variable 

95% 

Cl 

T 

P 

Area 

(330.6, 

399.8) 

-2.27 

0 . 049 

Puede  usarse  el  applet  Small  Sample  Test  of  a  Population  Mean  (Prueba  de  mues¬ 
tra  pequena  de  una  media  poblaeional)  para  visualizar  los  valores  p  para  pruebas 
de  una  o  de  dos  colas  de  la  media  poblaeional  p.  El  procedimiento  sigue  el  mismo 
patron  que  con  applets  previos.  El  usuario  introduce  los  valores  de  x,  n  y  s  y  presiona 
“Enter”  despues  de  cada  entrada;  el  applet  calculara  t  y  dara  la  opcion  de  escoger 
valores  p  de  una  o  de  dos  colas  ( Area  a  la  Izquierda,  Area  a  la  Derecha  o  Dos  Colas), 
asf  como  area  Central  que  el  usuario  no  necesitara. 


FIGURA  10.9 

Applet  Small  Sample 
Test  of  a  Population 
Mean 


1 

273 


x  bar  muU 

Ibfi  1 400 

4(1  41 /  /  SqRoot  Ml 

s  n 


Prob-0  0491 


365  0  435  0  x-bar 

•2  3  2.3  t 

|  w)  prob  HII4M 


Para  los  datos  del  ejemplo  10.4,  el  valor  p  es  el  area  de  dos  colas  a  la  derecha  de  t  = 
2.273  y  a  la  izquierda  de  t  =  —2.273.  ,-Puede  hallarse  este  mismo  valor  p  en  la  salida 
impresa  MINITAB  de  la  figura  10.9? 


Se  puede  ver  el  valor  de  usar  la  salida  impresa  de  computadora  o  el  applet  Java  para 
evaluar  resultados  estadfsticos: 

•  El  valor  p  exacto  elimina  la  necesidad  de  tablas  y  valores  crfticos. 

•  Todos  los  calculos  numericos  son  hechos  por  el  usuario. 

El  trabajo  mas  importante,  que  se  deja  al  experimentador,  es  interpretar  los  resultados 
en  terminos  de  su  jsignificancia  practical 
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© 


EJERCICIQS 


TECNICAS  BASICAS 


APLICACIONES 


10.1  Encuentre  los  siguientes  valores  t  en  la  tabla  4  del 
apendice  I: 

a.  1 05  para  5  df  b.  t  para  8  df 

c.  t. io  para  1 8  df  d.  tm 5  para  30  df 

10.2  Encuentre  el  (los)  valor(es)  crftico(s)  de  t  que 
especifiquen  la  region  de  rechazo  en  estas  situaciones: 

a.  Una  prueba  de  dos  colas  con  a  =  .01  y  12  df. 

b.  Una  prueba  de  cola  derecha  con  a  =  .05  y  16  df. 

c.  Una  prueba  de  dos  colas  con  a  =  .05  y  25  df. 

d.  Una  prueba  de  cola  izquierda  con  a  =  .01  y  7  df. 

10.3  Use  la  tabla  4  del  apendice  I  para  aproximar  el 
valor  p  para  la  estadistica  t  en  cada  situacion: 

a.  Una  prueba  de  dos  colas  con  t  =  2.43  y  12  df. 

b.  Una  prueba  de  cola  derecha  con  t  =  3.21  y  16  df. 

c.  Una  prueba  de  dos  colas  con  t  =  — 1.19  y  25  df. 

d.  Una  prueba  de  cola  izquierda  con  t  =  —8.77  y  7  df. 

(^)datos  10.4  Calif icaciones  de  examen  Las 

calificaciones  en  un  examen  de  100  puntos, 
registradas  para  20  estudiantes: 


71 

93 

91 

86 

75 

73 

86 

82 

76 

57 

84 

89 

67 

62 

72 

77 

68 

65 

75 

84 

a.  i  Puede  usted  suponer  razonablemente  que  estas 
calificaciones  de  examen  han  sido  seleccionadas  de 
una  poblacion  normal? 

b.  Calcule  la  media  y  desviacion  estandar  de  las 
calificaciones. 

c.  Si  estos  estudiantes  pueden  ser  considerados  como 
muestra  aleatoria  de  la  poblacion  de  todos  los 
estudiantes,  encuentre  un  intervalo  de  confianza  de 
95%  para  el  promedio  de  calificaciones  de  examen 
de  la  poblacion. 

10.5  Las  siguientes  n  =  10  observaciones  son  una 

muestra  de  una  poblacion  normal: 

7.4  7.1  6.5  7.5  7.6  6.3  6.9  7.7  6.5  7.0 

a.  Encuentre  la  media  y  desviacion  estandar  de  estos 
datos. 

b.  Encuentre  un  limite  superior  de  confianza  de  una  cola, 
de  99%,  para  la  media  poblacional  /x. 

c.  Pruebe  H0  :  p  =  7.5  contra  //a :  p  <  7.5.  Use  a  =  .01. 

d.  7, Los  resultados  del  inciso  b)  apoyan  sus  conclusiones 
del  inciso  c)? 


datos  10.6  Atunes  7,Hay  diferencia  en  los 

precios  del  atun,  dependiendo  del  metodo  de 
empaque?  Consumer  Reports  da  el  precio  promedio 
estimado  para  una  lata  de  6  onzas  o  bolsa  de  7.06  onzas 
de  atun,  con  base  en  precios  pagados  a  nivel  nacional 
en  supermercados.1  Estos  precios  estan  registrados  para 
varias  marcas  diferentes  de  atun. 

Atun  claro  Atun  bianco  Atun  bianco  Atun  claro 

en  agua  en  aceite  en  agua  en  aceite 


.99 

.53 

1.27 

1.49 

2.56 

.62 

1.92 

1.41 

1.22 

1.29 

1.92 

.66 

1.23 

1.12 

1.19 

1.27 

1.30 

62 

.85 

.63 

1.22 

1.35 

1.79 

.65 

.65 

.67 

1.29 

1.23 

.60 

.69 

.60 

1.00 

.67 

.60 

.66 

1.27 

1.28 

Fuente:  Estudio  practico  "Pricing  of  Tuna"  Copyright  2001  por  Consumers  Union  of  U.S.Inc., 
Yonkers,  NY  10703-1057,  organization  sin  fines  de  lucro.  Reimpreso  con  permiso  de  la 
edicion  de  junio  de  2001  de  Consumer  Report®  solo  con  fines  educativos.  No  se  permite 
uso  comercial  ni  reproduction.  www.ConsumerReports.org®. 

Suponga  que  las  marcas  de  atun  incluidas  en  este  estudio 
representan  una  muestra  aleatoria  de  todas  las  marcas  de 
atun  disponibles  en  Estados  Unidos. 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  el 
precio  promedio  para  atun  claro  en  agua.  Interprete 
este  intervalo.  Esto  es,  7,  a  que  se  refiere  ese  “95%”? 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  el 
precio  promedio  del  atun  bianco  en  aceite.  7  Como  se 
compara  el  ancho  de  este  intervalo  con  el  ancho  del 
intervalo  del  inciso  a)?  7, Puede  explicar  por  que? 

c.  Encuentre  intervalos  de  confianza  de  95%  para  las 
otras  dos  muestras  (atun  bianco  en  agua  y  atun  claro  en 
aceite).  Grafique  las  cuatro  medias  de  tratamiento  y  sus 
errores  estandar  en  una  grafica  bidimensional  semejante 
a  la  figura  8.5. 7,Que  clase  de  comparaciones  generales 
pueden  hacerse  acerca  de  los  cuatro  tratamientos? 
(Analizaremos  el  procedimiento  para  comparar  mas  de 
dos  medias  poblacionales  en  el  capitulo  11.) 

10.7  Contenido  de  02  disuelto  Los  desechos 
industrials  y  residuales  descargados  en  nuestros  rios  y 
arroyos  absorben  oxigeno  y,  por  tanto,  reducen  la  cantidad 
de  oxigeno  disuelto  disponible  para  peces  y  otras  formas  de 
fauna  acuatica.  Una  agencia  estatal  requiere  un  minimo 
de  5  partes  por  millon  (ppm)  de  oxigeno  disuelto  para 
que  el  contenido  de  oxigeno  sea  suficiente  para  sostener 
vida  acuatica.  Seis  especimenes  de  agua  tornados  de  un 
rio  en  un  lugar  especifico  durante  la  estacion  de  aguas 
bajas  (julio)  dio  lecturas  de  4.9,  5.1,  4.9,  5.0,  5.0  y  4.7  de 
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oxfgeno  disuelto.  ^Los  datos  dan  suficiente  evidencia  para 
indicar  que  el  contenido  de  oxfgeno  disuelto  es  menor  a 
5  ppm?  Pruebe  usando  a  =  .05. 

1 0.8  Langostas  En  un  estudio  de  la  infestation  de 
la  langosta  Thenus  orientalis  por  dos  tipos  de  lapas, 
Octolasmis  tridens  y  O.  lowei,  se  midieron  las  longitudes 
del  caparazon  (en  milfmetros)  de  10  langostas  seleccionadas 
al  azar  pescadas  en  los  mares  cerca  de  Singapur:2 
78  66  65  63  60  60  58  56  52  50 

Encuentre  un  intervalo  de  confianza  de  95%  para  la 
longitud  media  del  caparazon  de  langostas  T.  orientalis. 

(^)datos  10.9  Fumar  y  capacidad  pulmonar  Esun 
hecho  reconocido  que  fumar  tiene  un  efecto  dele- 
tereo  en  la  funcion  pulmonar.  En  un  estudio  del  efecto  de 
fumar  sobre  la  capacidad  de  difusion  de  monoxido 
de  carbono  (DL)  del  pulmon,  unos  investigadores 
encontraron  que  los  fumadores  actuales  tenfan  lecturas  de 
DL  considerablemente  mas  bajas  que  otros  que  habfan  sido 
fumadores  o  que  son  no  fumadores.  Las  capacidades  de 
difusion  de  monoxido  de  carbono  para  una  muestra  aleatoria 
de  n  =  20  fumadores  actuales  aparecen  a  continuation: 


103.768 

88.602 

73.003 

123.086 

91.052 

92.295 

61.675 

90.677 

84.023 

76.014 

100.615 

88.017 

71.210 

82.115 

89.222 

102.754 

108.579 

73.154 

106.755 

90.479 

a.  (tiistos  datos  indican  que  la  lectura  media  de  DL  para 
fumadores  actuales  es  considerablemente  mas  baja 
que  100  DL,  que  es  el  promedio  para  no  fumadores? 
Use  a  =  .01. 

b.  Encuentre  un  lfmite  superior  de  confianza  de  una  cola 
de  99%  para  la  lectura  media  de  DL  para  fumadores 
actuales.  ('iEste  lfmite  confirma  las  conclusiones  del 
inciso  a)? 

datos  10.10  rett  Favre  En  el  ejercicio  2.36 

(EX0236),  el  numero  de  pases  completos  por  Brett 
Favre,  mariscal  de  campo  de  los  Empacadores  de  Green 
Bay,  fue  registrado  para  cada  uno  de  los  16  juegos  regulares 
de  la  temperada  en  el  verano  de  2006  (ESPN.com).3 


15 

31 

25 

22 

22 

19 

17 

28 

24 

5 

22 

24 

22 

20 

26 

21 

a.  Una  grafica  de  tallo  y  hoja  de  las  n  =  16 
observaciones  se  muestra  a  continuation: 

Grafica  de  tallo  y  hoja:  Favre 

Stem-and-leaf  of  Favre  N  =16 
Leaf  Unit  =  1.0 
LO  5 

2  15 

3  17 

4  19 

6  2  01 

(4)  2  2222 

6  2  445 

3  2  6 

2  2  8 

13  1 


Con  base  en  esta  grafica,  ('  es  razonable  suponer  que  la 
poblacion  original  es  aproximadamente  normal,  como  se 
requiere  para  la  prueba  t  de  una  muestra?  Explique. 

b.  Calcule  la  media  y  desviacion  estandar  para  los  pases 
completos  por  juego  de  Brett  Favre. 

c.  Construya  un  intervalo  de  confianza  de  95%  para 
estimar  los  pases  completos  por  juego  de  Brett  Favre. 

10.11  Purification  de  un  compuesto  organico  Es 

frecuente  que  qufmicos  organicos  purifiquen  compuestos 
organicos  por  un  metodo  conocido  como  cristalizacion 
fraccional.  Un  experimentador  deseaba  preparar  y 
purificar  4.85  gramos  (g)  de  anilina.  Diez  cantidades 
de  anilina  de  4.85  g  fueron  preparadas  y  purificadas 
individualmente  a  acetanilido.  Se  registraron  los 
siguientes  rendimientos  en  seco: 

3.85  3.80  3.88  3.85  3.90 
3.36  3.62  4.01  3.72  3.82 

Estime  la  cantidad  media  en  gramos  de  acetanilido  que 
pueda  ser  recuperada  de  una  cantidad  inicial  de  4.85  g  de 
anilina.  Use  un  intervalo  de  confianza  de  95%. 

10.12  Compuestos  organicos,  continua  Consulte 
el  ejercicio  10.1 1.  ^Aproximadamente  cuantos 
especfmenes  de  4.85  g  de  anilina  se  requieren,  si  se 
desea  estimar  el  numero  medio  de  gramos  de  acetanilido 
correcto  a  no  mas  de  .06  g  con  probabilidad  igual  a  .95? 

10.13  Bulimia  Aun  cuando  hay  muchos  tratamientos 
para  la  bulimia  nerviosa,  algunas  personas  no  se 
benefician  del  tratamiento.  En  un  estudio  para  determinar 
que  factores  pronostican  quien  se  beneficiara  del 
tratamiento,  un  artfculo  en  el  British  Journal  of  Clinical 
Psychology  indica  que  la  autoestima  es  uno  de  estos 
importantes  pronosticadores.4  La  tabla  siguiente  da 

la  media  y  desviacion  estandar  de  calificaciones  de 
autoestima  para  tratamiento,  despues  del  tratamiento  y 
durante  un  seguimiento: 

Antes  del  trat.  Despues  del  trat.  Seguimiento 


Media  muestral  x 

20.3 

26.6 

21.1 

Desviacion  estandar  s 

5.0 

7.4 

8.2 

Tamano  muestral  n 

21 

21 

20 

a.  Use  una  prueba  de  hipotesis  para  determinar  si  hay 
suficiente  evidencia  para  concluir  que  la  media 
verdadera  de  tratamiento  es  menor  a  25. 

b.  Construya  un  intervalo  de  confianza  de  95%  para  la 
media  verdadera  despues  de  tratamiento. 

c.  En  la  section  10.4,  introduciremos  tecnicas  de 
muestra  pequena  para  hacer  inferencias  acerca  de 
la  diferencia  entre  dos  medias  poblacionales.  Sin  la 
formalidad  de  una  prueba  estadfstica,  7,que  esta  usted 
dispuesto  a  concluir  acerca  de  las  diferencias  entre  las 
tres  medias  poblacionales  muestreadas  representadas 
por  los  resultados  de  la  tabla? 
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(^)datos  10.14  lantidades  de  RBC  A  continuation 
veamos  las  cantidades  de  celulas  rojas 
sangumeas  (en  106  celulas  por  microlitro)  de  una 
persona  sana,  medidas  en  cada  uno  de  15  dfas: 


5.4 

5.2 

5.0 

5.2 

5.5 

5.3 

5.4 

5.2 

5.1 

5.3 

5.3 

4.9 

5.4 

5.2 

5.2 

Encuentre  una  estimacion  de  /x  del  intervalo  de  confianza 
de  95%,  la  verdadera  cantidad  media  de  celulas  rojas 
sangumeas  durante  el  periodo  de  prueba. 

(j^datos  10.15  Carne  para  hamburguesa  Estos 
datos  son  los  pesos  (en  libras)  de  27  paquetes 
de  carne  molida  en  un  exhibidor  de  carnes  de  un 
supermercado: 


1.08 

.99 

.97 

1.18 

1.41 

1.28 

.83 

1.06 

1.14 

1.38 

.75 

.96 

1.08 

.87 

.89 

.89 

.96 

1.12 

1.12 

.93 

1.24 

.89 

.98 

1.14 

.92 

1.18 

1.17 

a.  Interprete  las  salidas  impresas  siguientes  del  MINITAB 
para  los  procedimientos  de  prueba  de  una  muestra  y  de 
estimacion. 

Salidas  impresas  del  MINITAB  para  el  ejercicio  10.15 


T  de  una  muestra:  Peso 

Test  of  mu  =  1  vs  not  =  1 


Variable 

Weight 


N 

Mean 

StDev 

SE  Mean 

27 

1.0522 

0 . 1657 

0 . 0319 

Variable 

Weight 


95%  Cl 

(0.9867,  1.1178) 


T  P 

1.64  0.113 


b.  Verifique  los  valores  calculados  de  t  y  los  limites  de 
confianza  superiores  e  inferiores. 

datos  10.16  Colesterol  A  continuation  aparecen 
los  niveles  de  colesterol  seroso  de  50  personas 
seleccionadas  al  azar  de  entre  los  datos  del  L.A.  Heart 
Data,  de  un  estudio  epidemiologico  de  enfermedades  del 
corazon  en  empleados  del  condado  de  Los  Angeles.5 


148 

304 

300 

240 

368 

139 

203 

249 

265 

229 

303 

315 

174 

209 

253 

169 

170 

254 

212 

255 

262 

284 

275 

229 

261 

239 

254 

222 

273 

299 

278 

227 

220 

260 

221 

247 

178 

204 

250 

256 

305 

225 

306 

184 

242 

282 

311 

271 

276 

248 

a.  Construya  un  histograma  para  los  datos.  ,'.Los  datos 
tienen  forma  de  montfculo? 

b.  Use  una  distribucion  t  para  construir  un  intervalo 
de  confianza  de  95%  para  los  niveles  promedio  de 
colesterol  seroso  para  empleados  del  condado 

de  Los  Angeles. 

10.17  Colesterol,  continua  Consulte  el  ejercicio 
10.16.  Como  n  >  30,  use  los  metodos  del  capitulo  8 
para  crear  un  intervalo  de  confianza  de  95%  de  muestra 
grande  para  el  nivel  promedio  de  colesterol  seroso 
para  empleados  del  condado  de  Los  Angeles.  Compare 
los  dos  intervalos.  (sugerencia:  Los  dos  intervalos 
deben  ser  muy  semejantes.  Esta  es  la  razon  por  la  que 
escogimos  aproximar  la  distribucion  muestral  de 

X  —  UL 

,  /A  con  una  distribucion  z  cuando  n  >  30.) 
s/Vn 


INFERENCIAS  DE  MUESTRA  PEQUENA 
PARA  LA  DIFERENCIA  ENTRE  DOS 
MEDIAS  POBLACIONALES:  MUESTRAS 
ALEATORIAS  INDEPENDIENTES 

El  escenario  ffsico  para  el  problema  considerado  en  esta  seccion  es  el  mismo  que  el  de 
la  section  8.6,  excepto  que  los  tamanos  muestrales  ya  no  son  grandes.  Muestras  alea- 
torias  independientes  de  nl  y  n2  mediciones  se  sacan  de  dos  poblaciones,  con  medias  y 
varianzas  /x, ,  a\,  /jl2  y  er |,  y  el  objetivo  del  experimentador  es  hacer  inferencias  acerca 
de  (jjii  —  /jl2 ),  la  diferencia  entre  las  dos  medias  poblacionales. 

Cuando  los  tamanos  muestrales  son  pequenos,  ya  no  se  puede  confiar  en  el  teorema 
del  lfmite  central  para  asegurar  que  las  medias  muestrales  sean  normales,  pero,  si  las 
poblaciones  originales  son  normales,  entonces  la  distribucion  muestral  de  la  diferencia 
en  las  medias  muestrales,  (L,  —  x2),  sera  normal  (incluso  para  muestras  pequenas)  con 
media  (/jl1  —  /jl2 )  y  error  estandar 
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Suposiciones  para  la 
prueba  f  de  dos  muestras 
(independiente): 

•  Muestras  aleatorias 
independientes 

•  Distribuciones  normales 

•  <7,  =  <r2 


En  los  capftulos  7  y  8  empleamos  las  varianzas  muestrales,  s\  y  s\,  para  calcular  una 
estimation  del  error  estandar,  que  entonces  se  utilizo  para  formar  un  intervalo  de  con- 
fianza  de  muestra  grande  o  una  prueba  de  hipotesis  basada  en  el  estadfstico  z  de  muestras 
grandes: 


(*i  -  x2)  ~  (Mu  ~  p2) 

l~2 

~  +  — 

V  n  1  n2 


Desafortunadamente,  cuando  los  tamanos  muestrales  son  pequenos,  este  estadfstico  no 
tiene  una  distribucion  aproximadamente  normal  ni  tiene  una  distribucion  t  de  Student. 
Para  formar  una  estadfstica  con  una  distribucion  de  muestreo  que  pueda  deducirse  en 
forma  teorica,  es  necesario  hacer  una  suposicion  mas. 

Suponga  que  la  variabilidad  de  la  medicion  en  las  dos  poblaciones  normales  es  la 
misma  y  puede  ser  medida  por  una  varianza  comun  a2.  Esto  es,  ambas  poblaciones 
tienen  exactamente  la  misma  forma,  y  a2  =  cr\  =  a2.  Entonces  el  error  estandar  de  la 
diferencia  en  las  dos  medias  muestrales  es 


Se  puede  demostrar  matematicamente  que,  si  se  usa  la  estimacion  muestral  apropiada  s2 
para  la  varianza  poblacional  a2,  entonces  el  estadfstico  de  prueba  resultante, 


Ui  -  X2)  -  (Pi  -  p2) 


tiene  una  distribution  t  de  Student.  El  unico  problema  restante  es  hallar  la  estimacion 
muestral  s2  y  el  numero  apropiado  de  grados  de  libertad  para  el  estadfstico  t. 

Recuerde  que  la  varianza  poblacional  a2  describe  la  forma  de  las  distribuciones  nor¬ 
males  de  donde  provienen  las  muestras  del  experimentador,  de  modo  que  o  s\  le 
darfan  una  estimacion  de  er2.  Pero,  ^por  que  usar  solo  una  cuando  ambas  dan  informa- 
cion?  Un  mejor  procedimiento  es  combinar  la  informacion  en  ambas  varianzas  mues¬ 
trales  usando  un  promedio  ponderado,  en  el  que  los  pesos  estan  determinados  por  la 
cantidad  relativa  de  informacion  (el  numero  de  mediciones)  en  cada  muestra.  Por  ejem- 
plo,  si  la  primera  muestra  contenfa  el  doble  de  mediciones  que  la  segunda,  se  podrfa 
considerar  dar  a  la  primera  varianza  muestral  el  doble  de  peso.  Para  obtener  este  resul- 
tado,  use  esta  formula: 


s2  =  (»1  -  1)U  +  Oh  -  1)4 

77t  +  n2  —  2 

Recuerde  de  la  seccion  10.3  que  los  grados  de  libertad  para  el  estadfstico  t  de  una  mues¬ 
tra  son  {n  —  1),  el  denominador  de  la  estimacion  muestral  s2.  Como  ,v2  tiene  (n,  —  1)  df 
y  s22  tiene  (n2  —  1)  df,  el  numero  total  de  grados  de  libertad  es  la  suma 

(«!  —  1)  +  (n2  —  1)  =  /Zi  +  n2  —  2 

que  se  ve  en  el  denominador  de  la  formula  para  s2. 
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CALCULO  DE  s2 

•  Si  dispone  de  una  calculadora  cientifica,  calcule  cada  una  de  las  dos  desviaciones 
estandar  muestrales  .v,  y  s2  por  separado,  usando  el  procedimiento  de  entrada  de 
datos  para  su  calculadora  particular.  Estos  valores  son  elevados  al  cuadrado  y  se 
usan  en  esta  formula: 

^2  _  0l\  ~  1)^1  ~f  ( n2  ~  1)^2 

nl  +  n2  ~  2 


CONSEJO 


Para  la  prueba  fde  dos 
muestras  independientes 
df=  n,  +  n2~  2. 


Se  puede  demostrar  que  s2  es  un  estimador  insesgado  de  la  varianza  poblacional 
comun  er2.  Si  s2  se  usa  para  estimar  a2  y  si  las  muestras  se  han  sacado  al  azar  e  indepen- 
dientemente  de  poblaciones  normales  con  una  varianza  comun,  entonces  el  estadfstico 


Oi  -  x2)  ~  (Mi  “  M2) 


tiene  una  distribution  t  de  Student  con  («  +  n2  —  2)  grados  de  libertad.  La  estimation 
de  muestra  pequena  y  procedimientos  de  prueba  para  la  diferencia  entre  dos  medias  se 
dan  a  continuation. 


PRUEBA  DE  HIPOTESIS  RESPECTO  A  LA  DIFERENCIA 
ENTRE  DOS  MEDIAS:  MUESTRAS  ALEATORIAS 
INDEPENDIENTES 


1.  La  hipotesis  nula:  H0 :  (m  1  —  M2)  =  D0,  donde  D0  es  alguna  diferencia  especifi- 
cada  que  el  experimentador  desea  probar.  Para  numerosas  pruebas,  el  experimen- 
tador  hara  una  hipotesis  de  que  no  hay  diferencia  entre  Mi  y  M2;  esto  es,  I),,  =  0. 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 


:  (Mi  “  M2)  >  D0  Hd :  (mi  -  M2)  ^  D0 

[o  H, :  (mi  -  M2)  <  Ail 


3.  Estadfstico  de  prueba: 


(*i  ~  x2)  ~  D0 


donde 


,2  =  Oh  ~  1)^  +  (n2  -  1)a22 
tii  +  n2  —  2 


4.  Region  de  rechazo:  rechace  H0  cuando 

Prueba  de  una  cola  Prueba  de  dos  colas 

t>ta 

[o  t  <  —  ta  cuando  la  hipotesis 
alternativa  es  H1A :  (mi  —  M2)  <  Ail 

o  cuando  valor  p  <  a  ( conti nu a ) 
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PRUEBA  DE  HIPOTESIS  RESPECTO  A  LA  DIFERENCIA 
ENTRE  DOS  MEDIAS:  MUESTRAS  ALEATORIAS 
INDEPENDIENTES  ( continua ) 

Los  valores  crfticos  de  t,  ta  y  ta/2  estan  basados  en  (n,  +  n2  —  2)  df.  Los  valores 
tabulados  se  pueden  hallar  usando  la  tabla  4  del  apendice  I  o  el  applet  Student’s  t 
Probabilities. 

Suposiciones:  Las  muestras  se  seleccionan  al  azar  y  en  forma  independiente  de 
poblaciones  distribuidas  normalmente.  Las  varianzas  de  las  poblaciones  er2  y  a\ 
son  iguales. 


INTERVALO  DE  CONFIANZA  (1  -  a)100%  DE  MUESTRA 
PEQUENA  PARA  (/t,  -  /t2)  CON  BASE  EN  MUESTRAS 
ALEATORIAS  INDEPENDIENTES 


Ol  -  X2)  ±  t«/2  Jsi~ +  ~J 


donde  s2  es  la  estimacion  agrupada  de  a2. 


Puede  tomarse  un  curso  con  credito  ya  sea  asistiendo  a  sesiones  de  clases  en  horas  y  dias 
fijos,  o  haciendo  sesiones  en  linea  que  el  estudiante  puede  hacer  a  su  propio  paso  y  en 
los  tiempos  que  el  estudiante  escoja.  El  coordinador  del  curso  desea  determinar  si  estos 
dos  dias  de  tomar  el  curso  resultaron  en  una  diferencia  significativa  en  rendimiento 
medido  por  el  examen  final  para  el  curso.  La  siguiente  informacion  da  las  calificaciones 
en  un  examen  con  45  punt  os  posibles  para  un  grupo  de  /z,  =9  estudiantes  que  tomaron 
el  curso  en  linea  y  un  segundo  grupo  de  n2  =  9  estudiantes  que  tomaron  el  curso  de 
clases  convencionales.  Estos  datos  presentan  suficiente  evidencia  para  indicar  que  las 
calificaciones  para  estudiantes  que  tomaron  el  curso  en  linea  son  significativamente 
mas  altas  que  las  de  quienes  asistieron  a  una  clase  convencional? 


Calificaciones  de  examen  para  presentaciones  en  linea 
10.2  y  en  salon  de  clase 

En  linea  Salon  de  clase 


32 

35 

37 

31 

35 

29 

28 

25 

41 

34 

44 

40 

35 

27 

31 

32 

34 

31 

Solucion  Sean  p.  y  /jl2  las  calificaciones  medias  para  el  grupo  en  linea  y  el  grupo  del 
salon  de  clase,  respectivamente.  Entonces,  como  se  busca  evidencia  para  apoyar  la  teorfa 
de  que  p, t  >  fx2,  se  puede  probar  la  hipotesis  nula 

H0:  /x i  =  p,2  [o  H0 :  -  p,2)  =  0] 
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contra  la  hipotesis  alternativa 


H-d :  /r |  >  jx2  [o  Hd :  ~  /r2)  >  0] 

Para  efectuar  la  prueba  t  para  estas  dos  muestras  independientes,  se  debe  suponer  que 
las  poblaciones  muestreadas  son  normales  y  tienen  la  misma  varianza  cr2.  y Es  esto  razo- 
nable?  Las  graficas  de  tallo  y  hoja  de  la  figura  10.10  muestran  al  menos  un  patron  de 
“montfculo”,  de  modo  que  la  suposicion  de  normalidad  no  es  irracional. 


FIGURA  10.10 

Graficas  de  tailo  y  hoja 
para  el  ejemplo  10.5 


En  Ifnea  Salon  de  clase 


28  2  579 

3  124  3  1124 

3  557  35 

4  14  4  0 


Ademas,  las  desviaciones  estandar  de  las  dos  muestras,  calculadas  como 


CONSEJO 


jj  =  4.9441  y  s2  =  4.4752 


Las  graficas  de  tallo  y  hoja 
pueden  ayudar  a  decidir  si  la 
suposicion  de  normalidad  es 
razonable. 


no  son  diferentes  lo  suficiente  para  que  dudemos  de  que  las  dos  distribuciones  pueden 
tener  la  misma  forma.  Si  se  hacen  estas  dos  suposiciones  y  se  calcula  (usando  precision 
total)  la  estimation  agrupada  de  la  varianza  comiin  como 


2  _  (»1  ~  l)jj_+  («2  ~  1)4 

rii  +  n2  ~  2 


8(4.9441)2  +  8(4.4752)2 
9  +  9-2 


22.2361 


se  puede  calcular  entonces  el  estadfstico  de  prueba, 


t  = 


35.22  -  31.56 


/  22.2361 1  —  +  — 


1.65 


CONSEJO 


Si  usa  calculadora,  no 
redondee  sino  hasta  el  paso 
final. 


La  hipotesis  alternativa  Hd  :  /oq  >  /jl2  o,  lo  que  es  equivalente,  H, :  (/a,  —  /jl2 )  >  0  implica 
que  el  experimentador  debe  usar  una  prueba  de  una  cola  en  la  cola  superior  de  la  distribu¬ 
tion  f  con  +  n2  —  2)  =  16  grados  de  libertad.  Se  puede  hallar  el  valor  crftico  apropiado 
para  una  region  de  rechazo  con  a  =  .05  en  la  tabla  4  del  apendice  I,  y  H0  sera  rechazada  si 
t  >  1.746.  Comparando  el  valor  observado  del  estadfstico  de  prueba  t  =  1.65  con  el  valor 
crftico  7 05  =  1.746,  no  se  puede  rechazar  la  hipotesis  nula  (vease  la  figura  10.11).  Hay 
insuficiente  evidencia  para  indicar  que  las  calificaciones  del  curso  en  Ifnea  sean  mas  altas 
que  las  calificaciones  del  curso  convencional  al  nivel  de  significancia  de  5%. 


FIGURA  10.11 

Region  de  rechazo  para  el 
ejemplo  10.5 


X 

/ 

/ 

\ 

/ 

/ 

\ 

/ 

\  a  =  .05 

y 

_ 

0  1.746  r 


Rechazar  HQ 
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Encuentre  el  valor  p  que  serfa  reportado  para  la  prueba  estadfstica  del  ejemplo  10.5. 

Solucion  El  valor  observado  de  t  para  esta  prueba  de  una  cola  es  t  =  1.65.  Por 
tanto, 


valor  p  =  P(t  >  1.65) 

para  un  estadistico  t  con  16  grados  de  libertad.  Recuerde  que  no  se  puede  obtener  esta 
probabilidad  directamente  de  la  tabla  4  del  apendice  I;  solo  se  puede  limitar  el  valor  p 
usando  los  valores  crfticos  de  la  tabla.  Como  el  valor  observado,  t  =  1.65,  esta  entre 
Coo  =  1.337  y  1 050  =  1-746,  el  area  de  cola  a  la  derecha  de  1.65  esta  entre  .05  y  .10.  El 
valor  p  para  esta  prueba  se  informarfa  como 

.05  <  valor  p  <  .10 


Como  el  valor  p  es  mayor  a  .05,  casi  todos  los  investigadores  informanan  los  resulta- 
dos  como  no  significativos. 


Se  puede  usar  el  applet  Two-Sample  t-Test:  Independent  Samples  (Prueba  t  para 
dos  muestras:  Muestras  independientes),  que  se  ve  en  la  figura  10.12,  para  visua- 
lizar  los  valores  p  para  pruebas  ya  sea  de  una  o  de  dos  colas  de  la  diferencia  entre 
dos  medias  poblacionales.  El  procedimiento  sigue  el  mismo  patron  que  en  applets 
previos.  Es  necesario  introducir  un  resumen  estadistico,  es  decir,  los  valores  de  xh  x2, 
nu  n2,  s i  y  s2  y  presionar  “Enter”  despues  de  cada  entrada;  el  applet  calculara  t  (supo- 
niendo  varianzas  iguales)  y  dara  la  option  de  escoger  valores  p  de  una  o  de  dos  colas 
(Area  a  la  Izquierda,  Area  a  la  Derecha  o  Dos  Colas),  asi  como  un  area  Central  que 
no  se  necesitara. 


FIGURA  1  0.1  2 

Applet  Two-Sample 
f-Test:  Independent 
Samples 


ShuiiiIhI 

Sampie2 

or 


*-har 

(35.22 


31 

Mean  Dltr 
t(1  b)  ~  J.bb  f 

Prob-0  009G  z'-' 


\ 


4  944 
i  475 
Std  Error 
2.U3- 


_ 


t  Statistic 

1  bb 


37 

1.6 


diail  -  xhar? 

t 


Area  tn  Right  *  prob:  0  06 


Para  los  datos  del  ejemplo  10.5,  el  valor  p  es  el  area  de  una  cola  a  la  derecha  de  t  = 
1.65.  /El  valor  p  confirma  las  conclusiones  para  la  prueba  en  el  ejemplo  10.5? 
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Use  un  lfmite  inferior  de  confianza  de  95%  para  estimar  la  diferencia  (ji,  —  /jl2)  en  el 
ejemplo  10.5.  ^El  lfmite  de  confianza  inferior  indica  que  el  promedio  en  lmea  es  signifi- 
cativamente  mas  alto  que  el  promedio  de  salon  de  clase? 


Solution  El  lfmite  inferior  de  confianza  toma  una  forma  familiar,  es  decir,  el  estima- 
dor  puntual  (x,  —  x2)  menos  una  cantidad  igual  a  ta  por  el  error  estandar  del  estimador. 
Sustituyendo  en  la  formula,  se  puede  calcular  el  lfmite  inferior  de  confianza  de  95%: 


Ui  -  X2) 


(35.22  -  31.56) 


1.746 


22.2361 


3.66  -  3.88 


o  (yu-!  —  p,2)  >  —.22.  Como  el  valor  [p.x  —  p,2)  =  0  esta  incluido  en  el  intervalo  de 
confianza,  es  posible  que  las  dos  medias  sean  iguales.  Hay  insuficiente  evidencia  para 
indicar  que  el  promedio  en  lmea  sea  mas  alto  que  el  promedio  en  salon  de  clase. 


CONSEJO 

Mayor  s2/menor  s2  <  3 


<=> 

suposicion  de  varianza  es 
razonable. 


El  procedimiento  de  dos  muestras  que  usa  una  estimation  agrupada  de  la  varianza 
conuin  a2  se  apoya  en  cuatro  importantes  suposiciones: 

•  Las  muestras  deben  ser  seleccionadas  al  azar.  Las  muestras  no  seleccionadas  al 
azar  pueden  introducir  sesgo  en  el  experimento  y  asf  alterar  los  niveles  de  signifi- 
cancia  que  el  experimentador  informe. 

•  Las  muestras  deben  ser  independientes.  Si  no  es  asf,  este  no  es  el  procedimiento 
estadfstico  apropiado.  En  la  section  10.5  analizamos  otro  procedimiento  para 
muestras  dependientes. 

•  Las  poblaciones  de  las  cuales  se  muestrea  deben  ser  normales.  No  obstante,  las 
desviaciones  moderadas  desde  la  normalidad  no  afectan  seriamente  la  dis¬ 
tribution  del  estadfstico  de  prueba,  en  especial  si  los  tamanos  muestrales  son 
casi  iguales. 

•  Las  varianzas  poblacionales  deben  ser  iguales  o  casi  iguales  para  asegurar  que 
los  procedimientos  sean  validos. 

Si  las  varianzas  poblacionales  estan  lejos  de  ser  iguales,  hay  un  procedimiento  alter¬ 
native  para  estimation  y  prueba  que  tiene  una  distribution  t  aproximada  en  muestreo 
repetido.  Como  regia  practica,  se  debe  usar  este  procedimiento  si  la  razon  entre  las  dos 
varianzas  muestrales 

Mayor  s2  ^ 

Menor  s2 

Como  las  varianzas  poblacionales  no  son  iguales,  el  estimador  agrupado  .r  ya  no  es  apro¬ 
piado,  y  cada  varianza  poblacional  debe  ser  estimada  por  su  correspondiente  varianza 
muestral.  El  estadfstico  de  prueba  resultante  es 


(■ri  -  X2)  -  Do 
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Cuando  los  tamanos  muestrales  sean  pequenos,  los  valores  crfticos  para  este  estadistico 
se  encuentran  usando  grados  de  libertad  aproximados  por  la  formula 


df™ 


(sf/ntf  |  (sjhhf 
(n,  -  1)  (n2  ~  1) 


Los  grados  de  libertad  se  toman  como  la  parte  entera  de  este  resultado. 

Se  pueden  usar  paquetes  computarizados  como  el  MINITAB  para  poner  en  practica  este 
procedimiento,  a  veces  llamado  aproximacion  de  Satterthwaite’s,  asi  como  el  metodo 
agrupado  descrito  ya  antes.  De  hecho,  algunos  experimentadores  escogen  analizar  sus 
datos  usando  ambos  metodos.  Mientras  los  dos  analisis  lleven  a  las  mismas  conclusio- 
nes,  no  es  necesario  preocuparse  con  la  igualdad  o  desigualdad  de  varianzas. 

La  salida  impresa  MINITAB,  resultante  del  metodo  agrupado  de  analisis  para  los  datos 
del  ejemplo  10.5,  se  muestra  en  la  figura  10.13.  Observe  que  la  razon  entre  las  dos  va¬ 
rianzas  muestrales,  (4.94/4.48)2  =  1.22  es  menor  a  3,  lo  cual  hace  aproximado  el  metodo 
agrupado.  El  valor  calculado  de  t  =  1.65  y  el  valor  p  exacto  =  .059  con  16  grados  de 
libertad  se  muestran  en  la  ultima  linea  de  la  salida.  El  valor  p  exacto  hace  muy  facil 
determinar  la  significancia  o  no  significancia  de  los  resultados  muestrales.  Se  encontra- 
ran  instrucciones  al  generar  esta  salida  impresa  MINITAB  en  la  seccion  “Mi  MINITAB”  al 
final  de  este  capitulo. 


FIGURA  10.13 

Salida  impresa  MINITAB 
para  el  ejemplo  10.5 


Two-Sample  T-Test  and  Cl:  Online,  Classroom 
Two-sample  T  for  Online  vs  Classroom 

N  Mean  StDev  SE  Mean 

Online  9  35.22  4.94  1.6 

Classroom  9  31.56  4.48  1.5 

Difference  =  mu  (Online)  -  mu  (Classroom) 

Estimate  for  difference:  3.67 

95%  lower  bound  for  difference:  -0.21 

T-Test  of  difference  =  0  (vs  >)  :  T-Value  =  1.65  P-Value  =  0.059  DF  =  16 
Both  use  Pooled  StDev  =  4.7155 


Si  hay  razon  para  pensar  que  las  suposiciones  de  normalidad  han  sido  violadas,  se 
puede  probar  un  cambio  en  lugar  de  dos  distribuciones  poblacionales  usando  la  prueba 
de  suma  de  rango  no  parametrica  de  Wilcoxon  del  capitulo  15.  Este  procedimiento  de 
prueba,  que  requiere  menos  suposiciones  respecto  a  la  naturaleza  de  las  distribuciones 
de  probabilidad  poblacionales,  es  casi  igualmente  sensible  para  detectar  una  diferencia 
en  medias  poblacionales  cuando  las  condiciones  necesarias  para  la  prueba  t  se  satisfa- 
gan.  Puede  ser  mas  sensible  cuando  no  se  satisfaga  la  suposicion  de  normalidad. 


EJERCICIOS 


TECNICAS  BASICAS 


10.18  De  el  numero  de  grados  de  libertad  para  s2,  el 
estimador  agrupado  de  a2,  en  estos  casos: 

a.  «i  =  16,  n2  =  8 

b.  «]  =  10,  n2  =  12 

c.  n,  =  15,  n2  =  3 


10.19  Calcule  s2,  el  estimador  agrupado  de  a2,  en  estos 
casos: 


a.  «i  =  10,  n2  =  4,  s\  =  3.4,  s\  =  4.9 

b.  i%\  =  12,  n2  =  21,  s2  =  18,  s2  =  23 
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10.20  Dos  muestras  aleatorias  independientes  de 
tamanos  n,  =4  y  n2  =  5  se  seleccionan  de  cada  una 
de  dos  poblaciones  normales: 


Poblacion  1 

12  3  8  5 

Poblacion  2 

14  7  7  9  6 

a.  Calcule  s1,  el  estimador  agrupado  de  a2. 

b.  Encuentre  un  intervalo  de  confianza  de  90% 
para  (/jbl  —  /x2),  la  diferencia  entre  las  dos  medias 
poblacionales. 

c.  Prueba  H0  :  (/x,  —  /x2)  =  0  contra  //a :  (/x,  —  /x2)  <  0 
para  a  =  .05.  Exprese  sus  conclusiones. 

10.21  Muestras  aleatorias  independientes  de  n2  =  16 
y  n2  =  13  observaciones  fueron  seleccionadas  de  dos 
poblaciones  normales  con  iguales  varianzas: 

Poblacion 
1  2 

Tamano  muestral  16  13 

Media  muestral  34.6  32.2 

Varianza  muestral  4.8  5.9 

a.  Supongamos  que  usted  desea  detectar  una  diferencia 
entre  las  medias  poblacionales.  Exprese  la  hipotesis 
nula  y  alternativa  para  la  prueba. 

b.  Encuentre  la  region  de  rechazo  para  la  prueba  del 
inciso  a)  para  a  =  .01. 

c.  Encuentre  el  valor  del  estadfstico  de  prueba. 

d.  Encuentre  el  valor  p  aproximado  para  la  prueba. 

e.  Realice  la  prueba  y  exprese  sus  conclusiones. 

10.22  Consulte  el  ejercicio  10.21.  Encuentre  un 
intervalo  de  confianza  de  99%  para  (/ xx  —  /x2). 

10.23  La  salida  impresa  MINITAB  muestra  una  prueba 
de  la  diferencia  en  dos  medias  poblacionales. 

Salida  impresa  MINITAB  para  el  ejercicio  10.23 

Prueba  T  de  dos  muestras  y  Cl:  muestra  1,  muestra  2 
Two- sample  T  for  Sample  1  vs  Sample  2 

N  Mean  StDev  SE  Mean 

Sample  16  29.00  4.00  1.6 

Sample  27  28.86  4.67  1.8 

Difference  =  mu  (Sample  1)  -  mu  (Sample  2) 

Estimate  for  difference:  0.14 

95%  Cl  for  difference:  (-5.2,  5.5) 

T-Test  of  difference  =  0  (vs  not  =) : 

T-Value  =  0.06  P-Value  =0.95  DF  =  11 
Both  use  Pooled  StDev  =  4.38 

a.  pLas  dos  desviaciones  muestrales  estandar  indican  que 
la  suposicion  de  una  varianza  poblacional  comun  es 
razonable? 


b.  ^Cual  es  el  valor  observado  del  estadfstico 

de  prueba?  ^Cual  es  el  valor  p  asociado  con  esta 
prueba? 

c.  (',CuaI  es  la  estimacion  agrupada  s2  de  la  varianza 
poblacional? 

d.  Use  las  respuestas  al  inciso  b)  para  sacar 
conclusiones  acerca  de  la  diferencia  en  las  dos  medias 
poblacionales. 

e.  Encuentre  el  intervalo  95%  para  la  diferencia  en  las 
medias  poblacionales.  (;Este  intervalo  confirma  sus 
conclusiones  del  inciso  d)? 


APLICACIONES 

10.24  Dientes  sanos  Jan  Lindhe  realizo  un  estudio 
sobre  el  efecto  de  un  enjuague  oral  antiplaca  sobre  la 
acumulacion  de  placa  en  dientes.6  Catorce  personas 
cuyos  dientes  estaban  muy  limpios  y  pulidos  se  asignaron 
al  azar  a  dos  grupos  de  siete  personas  cada  uno.  Ambos 
grupos  fueron  asignados  para  usar  enjuagues  orales  (no 
cepillado)  durante  un  periodo  de  dos  semanas.  El  grupo  1 
utilizo  un  enjuague  que  contenfa  un  agente  antiplaca.  El 
grupo  2,  el  grupo  de  control,  recibio  un  enjuague  similar 
excepto  que,  sin  saberlo  las  personas,  el  enjuague  no 
contenfa  agente  antiplaca.  Un  fndice  x  de  placa,  medida 
de  acumulacion  de  placa,  fue  registrado  a  las  4,  7  y  14 
dfas.  La  media  y  desviacion  estandar  para  las  mediciones 
de  placa  de  14  dfas  se  muestran  en  la  tabla  para  los  dos 
grupos. 

Grupo  de  control  Grupo  antiplaca 

Tamano  muestral  7  7 

Media  1.26  .78 

Desviacion  estandar  .32  .32 

a.  Exprese  la  hipotesis  nula  y  alternativa  que  deberfan 
usarse  para  probar  la  efectividad  del  enjuague  oral 
antiplaca. 

b.  (:,Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  enjuague  oral  antiplaca  es  eficaz?  Pruebe  usando 
cr  =  .05. 

c.  Encuentre  el  valor  p  aproximado  para  la  prueba. 

(^)datos  10.25  Atun,  otra  vez  En  el  ejercicio 

10.6  hemos  presentado  datos  sobre  el  precio 
promedio  estimado  para  una  lata  de  6  onzas  o  una  bolsa 
de  7.06  onzas  de  atun,  con  base  en  precios  pagados  a 
nivel  nacional  en  supermercados.  Una  parte  de  los  datos 
se  reproduce  en  la  tabla  siguiente.  Use  la  salida  impresa 
MINITAB  para  contestar  las  preguntas. 
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Atun  claro 
en  agua 

Atun  claro 
en  aceite 

.99 

.53 

2.56 

.62 

1.92 

1.41 

1.92 

.66 

1.23 

1.12 

1.30 

.62 

.85 

.63 

1.79 

.65 

.65 

.67 

1.23 

.60 

.69 

.60 

.67 

.60 

.66 

Salida  impresa  MINITABpara  el  ejercicio  10.25 

Prueba  T  de  dos  muestras  y  Cl:  agua,  aceite 


Two- sample 

T  for  Water 

vs  Oil 

N 

Mean 

StDev  SE  Mean 

Water  14 

0 . 896 

0.400 

0 . 11 

Oil  11 

1 . 147 

0 . 679 

0.20 

Difference 

=  mu  (Water) 

-  mu  (Oil) 

Estimate  for  difference 

:  -0.251 

95%  Cl  for 

difference : 

(-0.700,  0. 

198) 

T-Test  of  difference  = 

0  (vs  not  = 

)  : 

T-Value  =  -1.16  P-Value  =  0.260  DF  =  23 
Both  use  Pooled  StDev  =  0.5389 

a.  pLos  datos  de  la  tabla  presentan  suficiente  evidencia 
para  indicar  una  diferencia  en  los  precios  promedio  de 
atun  claro  en  agua  contra  atiin  claro  en  aceite?  Pruebe 
usando  a  =  .05. 

b.  ('Cual  es  el  valor  p  para  la  prueba? 

c.  El  analisis  del  MINITAB  usa  la  estimacion  agrupada  de 
cr2.  2iLa  suposicion  de  iguales  varianzas  es  razonable? 
<,  Por  que  sf  o  por  que  no? 

10.26  Corredores  y  ciclistas  Elsmdromedel 
compartimiento  anterior  cronico  es  una  afeccion 
caracterizada  por  dolor  inducido  por  ejercicio  en  la  parte 
inferior  de  las  piernas.  Hinchazon  y  funcion  danada  en 
nervios  y  musculos  tambien  acompanan  a  este  dolor, 
que  se  alivia  con  reposo.  Susan  Beckham  y  colegas 
efectuaron  un  experimento,  donde  participaron  10 
corredores  sanos  y  10  ciclistas  sanos,  para  determinar  si 
hay  diferencias  significativas  en  mediciones  de  presion 
dentro  del  compartimiento  anterior  del  musculo  para 
corredores  y  ciclistas.7  El  resumen  de  datos,  presion 
del  compartimiento  en  milfmetros  de  mercurio  (Hg),  es 
como  sigue: 


Corredores 

Ciclistas 

Afeccion 

Media 

Desviacion 

estandar 

Media 

Desviacion 

estandar 

En  reposo 

80%  maximo 

14.5 

3.92 

11.1 

3.98 

consumo  de  02 

12.2 

3.49 

11.5 

4.95 

Maximo  consumo  de  02 

19.1 

16.9 

12.2 

4.47 

a.  Pruebe  para  una  diferencia  significativa  en  presion 
del  compartimiento  entre  corredores  y  ciclistas  bajo  la 
condicion  de  reposo.  Use  a  =  .05. 


b.  Construya  una  estimacion  de  intervalo  de  confianza 
de  95%  de  la  diferencia  en  medias  para  corredores 

y  ciclistas,  bajo  la  condicion  de  ejercitarse  a  80%  de 
consumo  maximo  de  oxfgeno. 

c.  Con  el  fin  de  probar  para  una  diferencia  significativa 
en  presion  del  compartimiento  a  maximo  consumo 
de  oxfgeno, dcbe  usarse  la  prueba  t  agrupada  o  no 
agrupada?  Explique. 

1 0.27  Desinfectantes  Un  experimento  publicado  en 
The  American  Biology  Teacher  estudio  la  eficacia  de  usar 
95%  de  etanol  o  20%  de  blanqueador,  como  desinfectante 
para  eliminar  la  contaminacion  por  bacterias  y  hongos  en 
cultivos  de  tejidos  de  plantas.  El  experimento  se  repitio  15 
veces  con  cada  desinfectante  usando  berenjenas  como  tejido 
de  planta  cultivada.8  Cinco  cortes  por  planta  se  colocaron 
en  una  caja  de  Petri  para  cada  desinfectante  y  se  guardaron 
a  25°C  durante  4  semanas.  La  observation  informada  fue  el 
numero  de  cortes  no  contaminados  de  berenjena  despues 
del  almacenamiento  de  4  semanas. 

Desinfectante  95%  etanol  20%  de  blanqueador 

Media  3.73  4.80 

Varianza  2.78095  .17143 

n  15  15 

Varianza  agrupada  1.47619 

a.  (:,Esta  usted  dispuesto  a  suponer  que  las  varianzas 
originales  son  iguales? 

b.  Usando  la  information  del  inciso  a),  /esta  usted 
dispuesto  a  concluir  que  hay  una  diferencia 
significativa  en  los  numeros  medios  de  berenjenas  no 
contaminadas  para  los  dos  desinfectantes  probados? 

datos  10.28  ritanio  Un  geologo  recolecto  20 

muestras  diferentes  de  mineral,  todas  del  mismo 
peso  y  al  azar  las  dividio  en  dos  grupos.  Los  contenidos 
de  titanio  de  las  muestras,  que  encontro  usando  dos 
metodos  diferentes,  se  detallan  en  la  tabla: 


Metodo  1 

Metodo  2 

.011 

.013  .013 

015 

.014 

.011 

.016  .013 

012 

.015 

.013 

.010  .013 

Oil 

.012 

.012 

.017  .013 

014 

.015 

a.  Use  un  metodo  apropiado  con  el  fin  de  probar  para  una 
diferencia  significativa  en  los  contenidos  promedio  de 
titanio  usando  los  dos  metodos  diferentes. 

b.  Determine  una  estimacion  del  intervalo  de 
confianza  de  95%  para  (/xx  —  /x2).  <:,La  estimacion 
de  su  intervalo  justifica  su  conclusion  del  inciso  a)? 
Explique. 

datos  10.29  ’asitas  El  numero  de  pasitas  en 

cada  una  de  14  minicajas  (tamano  de  1/2  onza) 
se  conto  para  pasitas  de  una  marca  generica  y  para  las 
S  unmaid®. 
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Marca  generica 

Sunmaid 

25 

26 

25 

28 

25 

29 

24 

24 

26 

28 

28 

27 

28 

24 

28 

22 

26 

27 

24 

25 

25 

28 

30 

27 

26 

26 

28 

24 

a.  Aun  cuando  las  cantidades  tienen  una  distribucion 
normal,  yestos  datos  tienen  distribuciones 
aproximadamente  normales?  (sugerencia:  Use  un 
histograma  o  grafica  de  tallo  y  hoja.) 

b.  (',Esta  usted  dispuesto  a  suponer  que  las  varianzas 
poblacionales  originales  son  iguales?  7,  Por  que? 

c.  Use  el  metodo  del  valor  p  para  determinar  si  hay  una 
diferencia  significativa  en  los  numeros  medios  de 
pasitas  por  minicaja.  ^Cuales  son  las  implicaciones 
de  su  conclusion? 

10.30  Contenido  de  02  disuelto,  continua  Consulte 
el  ejercicio  10.7,  en  el  que  medimos  el  contenido 
de  oxrgeno  disuelto  en  agua  de  rio  para  determinar  si  un 
arroyo  tenia  suficiente  oxigeno  para  soportar  vida  acuatica. 
Un  inspector  de  control  de  contaminacion  sospechaba 
que  la  comunidad  de  un  rio  estaba  vertiendo  cantidades 
de  aguas  negras  poco  tratadas  al  rio.  Para  comprobar  su 
teorfa,  saco  cinco  especrmenes  de  agua  de  rio  escogidos  al 
azar  en  un  lugar  aguas  arriba  del  pueblo,  y  otros  cinco  de 
aguas  abajo.  Las  lecturas  de  oxrgeno  disuelto  (en  partes 
por  millon)  son  como  sigue: 


Aguas  arriba 

4.8  5.2 

5.0  4.9 

5.1 

Aguas  abajo 

5.0  4.7 

4.9  4.8 

4.9 

a.  ^Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  contenido  medio  de  oxigeno  aguas  abajo  del  pueblo 
es  menor  que  el  contenido  medio  de  oxigeno  aguas 
arriba?  Pruebe  usando  a  =  .05. 

b.  Supongamos  que  usted  prefiere  la  estimacion  como 
metodo  de  inferencia.  Estime  la  diferencia  en  los 
contenidos  medios  de  oxigeno  disuelto  para  lugares 
aguas  arriba  y  abajo  del  pueblo.  Use  un  intervalo  de 
confianza  de  95%. 

(^)datos  10.31  Nadadores  de  estilo  libre  Enun 
esfuerzo  por  comparar  los  tiempos  promedio 
de  natacion  para  dos  nadadores,  a  cada  nadador  se  le 
pidio  nadar  en  estilo  libre  una  distancia  de  100  yardas  en 
tiempos  seleccionados  al  azar.  Los  nadadores  descansaron 
por  completo  entre  vueltas  y  no  corrieron  uno  contra  otro, 
de  modo  que  cada  muestra  de  tiempos  era  una  muestra 
aleatoria  independiente.  Se  muestran  los  tiempos  para 
cada  una  de  las  pruebas  para  los  dos  nadadores. 


Nadador 1 

Nadador  2 

59.62 

59.74 

59.81 

59.41 

59.48 

59.43 

59.32 

59.63 

59.65 

59.72 

59.76 

59.50 

59.50 

59.63 

59.64 

59.83 

60.01 

59.68 

59.86 

59.51 

Suponga  que  el  nadador  2  fue  el  ganador  del  ano  pasado 
cuando  los  dos  nadadores  compitieron.  y  Le  parece  que  el 
tiempo  promedio  para  el  nadador  2  es  todavra  mas  rapido 
que  el  tiempo  promedio  para  el  nadador  1  en  el  estilo 
libre  de  100  yardas?  Encuentre  el  valor  p  aproximado 
para  la  prueba  e  interprete  los  resultados. 


10.32  Nadadores  de  estilo  libre,  continua  Consulte 
el  ejercicio  10.31.  Construya  un  limite  inferior  de 
confianza  de  una  cola  y  95%  para  la  diferencia  en  los 
tiempos  promedio  para  los  dos  nadadores.  ('  Este  intervalo 
confirma  sus  conclusiones  en  el  ejercicio  10.31? 

(^)datos  10.33  Comparacion  de  mariscales  de 

campo  de  la  NFL  ^Como  se  compara  Brett 
Favre,  mariscal  de  campo  de  los  empacadores  de  Green 
Bay,  con  Peyton  Manning,  mariscal  de  campo  de  los 
Potros  de  Indianapolis?  La  tabla  siguiente  muestra  el 
numero  de  pases  completos  para  cada  atleta  durante  la 
temporada  de  futbol  de  2006  de  la  NFL:3 


Brett  Favre 


15 

17 

22 

31 

28 

20 

25 

24 

26 

22 

5 

21 

22 

22 

19 

24 

Peyton  Manning 


25 

32 

25 

26 

30 

29 

14 

27 

21 

21 

20 

22 

20 

14 

25 

21 

a.  7  Los  datos  indican  que  hay  una  diferencia  en  el 
numero  promedio  de  pases  completos  para  los  dos 
mariscales  de  campo?  Pruebe  usando  a  =  .05. 

b.  Construya  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  el  numero  promedio  de  pases  completos 
para  los  dos  mariscales  de  campo.  (jEI  intervalo  de 
confianza  confirma  su  conclusion  del  inciso  a)?  Explique. 

(^)datos  10.34  Jn  hallazgo  arqueologico  Un 

articulo  en  Archaeometry  involucraba  un 
analisis  de  26  muestras  de  ceramica  romano-inglesa, 
halladas  en  hornos  de  cuatro  sitios  diferentes  en  el  Reino 
Unido.9  Las  muestras  se  analizaron  para  determinar 
su  composicion  qurmica  y  el  porcentaje  de  oxido  de 
aluminio  en  cada  una  de  10  muestras  en  dos  lugares  se 
muestra  a  continuacion. 


Island  Thorns 

Ashley  Rails 

18.3 

17.7 

15.8 

18.3 

18.0 

16.7 

18.0 

14.8 

20.8 

19.1 

7  Los  datos  dan  suficiente  information  para  indicar  que  hay 
una  diferencia  en  el  promedio  de  porcentaje  de  oxido 
de  aluminio  en  los  dos  lugares?  Pruebe  al  nivel  de 
significance  de  5%. 
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INFERENCIAS  DE  MUESTRA  PEQUENA 
PARA  LA  DIFERENCIA  ENTRE  DOS 
MEDIAS:  UNA  PRUEBA  DE  DIFERENCIA 
PAREADA 

Para  comparar  las  cualidades  de  desgaste  de  dos  tipos  de  llantas  de  automovil,  A  y  B, 
una  llanta  de  tipo  A  y  una  de  tipo  B  se  asignaron  al  azar  y  se  montaron  en  las  ruedas 
traseras  de  cada  uno  de  cinco  automoviles.  Estos  se  hicieron  correr  un  numero  especi- 
ficado  de  millas  y  se  registro  la  cantidad  de  desgaste  para  cada  llanta.  Estas  mediciones 
aparecen  en  la  tabla  10.3.  7  Los  datos  presentan  suflciente  evidencia  para  indicar  una 
diferencia  en  el  promedio  de  desgaste  para  los  dos  tipos  de  llantas? 


tabla  10.3  Promedio  de  desgaste  para  dos  tipos  de  llantas 


Automovil 

Tipo  A 

Tipo  B 

1 

10.6 

10.2 

2 

9.8 

9.4 

3 

12.3 

11.8 

4 

9.7 

9.1 

5 

8.8 

8.3 

x,  =  10.24 

ir2  =  9.76 

s,  =  1.316 

s2=  1.328 

La  tabla  10.3  muestra  una  diferencia  de  (xi  —  x2)  =  (10.24  —  9.76)  =  .48  entre  las 
dos  medias  muestrales,  en  tanto  que  las  desviaciones  estandar  de  ambas  muestras  son 
aproximadamente  1.3.  Dada  la  variabilidad  de  los  datos  y  el  pequeno  numero  de  medi¬ 
ciones,  esta  es  mas  bien  una  diferencia  pequena  y  es  probable  que  no  se  sospeche  una 
diferencia  en  el  desgaste  promedio  para  los  dos  tipos  de  llantas.  Veamos  las  sospechas 
usando  los  metodos  de  la  seccion  10.4. 

Vea  el  analisis  MINITAB  de  la  figure  10.14.  La  prueba  t  agrupada  de  dos  muestras  se 
usa  para  probar  la  diferencia  en  las  medias  basada  en  dos  muestras  aleatorias  indepen- 
dientes.  El  valor  calculado  de  t  usado  para  probar  la  hipotesis  nula  H0  :  =  pb2  es  t  = 

.57  con  valor  p  =  .582,  valor  que  no  es  casi  suficientemente  pequeno  para  indicar  una 
diferencia  significativa  en  las  dos  medias  poblacionales.  El  correspondiente  intervalo  de 
confianza  de  95%,  dado  como 

- 1.448  <(jil  —  p,2)  <  2.408 

es  bastante  ancho  y  no  indica  una  diferencia  significativa  en  las  medias  poblacionales. 


FIGURA  10.14 

Salida  impresa  MINITAB 
usando  prueba  fpara 
muestras  independientes 
para  los  datos  de  llantas 


Prueba  T  de  dos  muestras  y  Cl:  llanta  A,  llanta  B 

Two-sample  T  for  Tire  A  vs  Tire  B 

N  Mean  StDev  SE  Mean 

Tire  A  5  10.24  1.32  0.59 

Tire  B  5  9.76  1.33  0.59 


Difference  =  mu  (Tire  A)  -  mu  (Tire  B) 

Estimate  for  difference:  0.480 

95%  Cl  for  difference:  (-1.448,  2.408) 

T-Test  of  difference  =  0  (vs  not  =)  :  T-Value  =  0.57  P-Value  =  0.582  DF  =  8 
Both  use  Pooled  StDev  =  1.3221 
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Veamos  de  nuevo  los  datos  y  se  observara  que  la  medicion  del  desgaste  para  el  tipo 
A  es  mayor  que  el  correspondiente  valor  para  el  tipo  B,  para  cada  uno  de  los  cinco  auto¬ 
moviles.  /No  seria  esto  probable,  si  en  realidad  no  hay  diferencia  entre  los  dos  tipos  de 
llantas? 

Considere  una  prueba  intuitiva  sencilla,  basada  en  la  distribution  binomial  del  capf- 
tulo  5.  Si  no  hay  diferencia  en  el  desgaste  medio  para  los  dos  tipos  de  llantas,  enton- 
ces  es  igualmente  probable  o  no  probable  que  la  llanta  A  muestre  mas  desgaste  que  la 
llanta  B.  Los  cinco  automoviles  entonces  corresponden  a  cinco  intent  os  binomiales  con 
p  =  P(llanta  A  muestra  mas  desgaste  que  la  llanta  B)  =  .5.  /Es  poco  comun  el  valor 
observado  de  x  =  5  diferencias  positivas  mostradas  en  la  tabla  10.4?  La  probabilidad 
de  observar  x  =  5  o  el  igualmente  probable  valor  de  x  =  0  se  puede  hallar  en  la  tabla  1  del 
apendice  I  que  son  2(.031)  =  .062,  que  es  bastante  pequeno  en  comparacion  con  la 
probabilidad  de  la  mas  potente  prueba  t,  que  tenia  un  valor  p  de  .58.  /No  es  peculiar 
que  la  prueba  t,  que  usa  mas  informacion  (las  mediciones  muestrales  reales)  que  la 
prueba  binomial,  no  de  suficiente  informacion  para  rechazar  la  hipotesis  nula? 

tabla  io.4  Diferencias  en  desgaste  de  llantas,  usando  los  datos  de  la  tabla  10.3 


Automovil 

A 

B 

d=A- B 

1 

10.6 

10.2 

.4 

2 

9.8 

9.4 

.4 

3 

12.3 

11.8 

.5 

4 

9.7 

9.1 

.6 

5 

CO 

CO 

8.3 

.5 

d  =  .48 


Hay  una  explication  para  esta  inconsistencia.  La  prueba  t  descrita  en  la  section  10.4 
no  es  la  prueba  estadistica  propia  a  usar  para  nuestro  ejemplo.  El  procedimiento  de 
prueba  estadistica  de  la  section  10.4  requiere  que  las  dos  muestras  sean  independientes 
y  aleatorias.  Ciertamente,  el  requisito  de  independencia  es  violado  por  la  forma  en  la 
que  se  realizo  el  experimento.  El  par  de  mediciones,  en  las  llantas  A  y  B,  para  un  auto¬ 
movil  particular  estan  definitivamente  relacionadas.  Una  mirada  a  los  datos  muestra  que 
las  lecturas  tienen  mas  o  menos  la  misma  magnitud  para  un  automovil  particular  pero 
varfan  en  forma  marcada  de  un  automovil  a  otro.  Esto,  por  supuesto,  es  exactamente 
lo  que  podria  esperarse.  El  desgaste  de  llantas  esta  determinado  en  su  mayor  parte  por 
habitos  de  manejo,  el  balanceo  de  las  ruedas  y  la  superficie  del  pavimento.  Como  cada 
automovil  tiene  un  conductor  diferente,  es  de  esperarse  una  gran  cantidad  de  variabili- 
dad  en  los  datos  de  un  automovil  a  otro. 

A1  disenar  el  experimento  de  desgaste  de  llantas,  el  experimentador  vio  que  las  medi¬ 
ciones  variarfan  en  gran  medida  de  un  automovil  a  otro.  Si  las  llantas  (cinco  del  tipo  A 
y  cinco  del  tipo  B)  se  asignaran  al  azar  a  las  10  ruedas,  resultando  en  muestras  aleatorias 
independientes,  esta  variabilidad  resultarfa  en  un  gran  error  estandar  y  hacer  dificil  de 
detectar  una  diferencia  en  las  medias.  En  cambio,  el  experimentador  escogio  “parear” 
las  mediciones,  comparando  el  desgaste  para  llantas  tipo  A  y  tipo  B  en  cada  uno  de 
los  cinco  automoviles.  Este  diseno  experimental,  a  veces  llamado  diseno  de  diferencia 
pareada  o  pares  acoplados,  nos  permite  eliminar  la  variabilidad  de  un  auto  a  otro  al  ver 
solo  las  cinco  mediciones  de  diferencia  mostradas  en  la  tabla  10.4.  Estas  cinco  diferen¬ 
cias  forman  una  sola  muestra  aleatoria  de  tamano  n  =  5. 

Observe  que  en  la  tabla  10.4  la  media  muestral  de  las  diferencias,  d  =  A  —  B,  se 
calcula  como 


n 
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y  es  exactamente  la  misma  que  la  diferencia  de  las  medias  muestrales:  (x  —  x2)  = 
(10.24  —  9.76)  =  .48.  No  debe  sorprender  que  esto  se  pueda  demostrar  como  verdadero 
en  general  y  tambien  que  la  misma  relation  se  cumpla  para  las  medias  poblacionales. 
Esto  es,  el  promedio  de  las  diferencias  poblacionales  es 

Md  =  (Mi  “  M2) 

Debido  a  esto,  se  pueden  usar  las  diferencias  muestrales  para  probar  una  diferencia  sig- 
nificativa  en  las  dos  medias  poblacionales,  (/x,  —  /jl2 )  =  \xd.  La  prueba  es  una  prueba  t  de 
una  sola  muestra  de  las  mediciones  de  diferencia  para  probar  la  hipotesis  nula 

H0 :  Mrf  =  0  [o  H0:  (Mi  “  M2)  =  0] 


contra  la  hipotesis  alternativa 


//a :  M</  ^  0  [off,:  (mi  “  M2)  ^  0] 

Los  procedimientos  de  prueba  toman  la  misma  forma  que  los  procedimientos  empleados 
en  la  section  10.3  y  se  describen  a  continuation. 


PRUEBA  DE  HIPOTESIS  DE  DIFERENCIA  PAREADA 
PARA  (/*!  -  fjL2)  =  fjLd:  MUESTRAS  DEPEND  I ENTES 

1 .  Hipotesis  nula:  H0:  /JLd  =  0 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola 

Hd :  ixrI  >  0 
(o  Ha :  i±d  <  0) 

3.  Estadistico  de  prueba:  t  =  -  , 

sd/Vn 

donde  n  =  Numero  de  diferencias  pareadas 

d  =  Media  de  las  diferencias  muestrales 

sd  =  Desviacion  estandar  de  las  diferencias  muestrales 

4.  Region  de  rechazo:  rechazar  H0  cuando 

Prueba  de  una  cola  Prueba  de  dos  colas 

t>ta  t  >  tal2  o  t  <  ~ta/2 

(o  t  <  —ta  cuando  la  hipotesis 
alternativa  sea  Ha  :  /xd<  0) 

o  cuando  valor  p  <  a 

Los  valores  crfticos  de  t,  t„  y  t„J2  estan  basados  en  (n  —  1 )  df  Estos  valores  tabulados 
se  pueden  hallar  usando  la  tabla  4  o  el  applet  Student’s  t  Probabilities. 


Prueba  de  dos  colas 

Ha :  Mrf  +  0 


d 

sjVn 
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INTERVALO  DE  CONFIANZA  DE  MUESTRA  PEQUENA 
(1  -  a)1  00%  PARA  (/t!  -  fji2)  =  CON  BASE  EN  UN 
EXPERIMENTO  DE  DIFERENCIA  PAREADA 


d  ±  t, 


(  Sd 

\Vn 


Suposiciones:  El  experimento  esta  disenado  como  una  prueba  de  diferencia  pareada 
de  modo  que  las  n  diferencias  representan  una  muestra  aleatoria  tomada  de  una  pobla- 
cion  normal. 


I  Los  datos  de  la  tabla  10.3  dan  suficiente  evidencia  para  indicar  una  diferencia  en  el 
desgaste  medio  para  llantas  tipo  A  y  B?  Pruebe  usando  a  =  .05. 


Solucion  Usted  puede  verificar,  usando  su  calculadora,  que  el  promedio  y  desvia- 
cion  estandar  de  las  cinco  mediciones  de  diferencia  son 


d  =  .48  y  sd=  .0837 
Entonces 


H0:  p,d  =  0  y  H, :  fxd  A  0 


y 

t  =  d- 0  _  .48 

sJVn  .Q837/V5 


12.8 


El  valor  crftico  de  t  para  una  prueba  estadfstica  de  dos  colas,  a  =  .05  y  4  df  es  2.776. 
Ciertamente,  el  valor  observado  de  t  =  12.8  es  muy  grande  y  significativo.  En  consecuen- 
cia,  se  puede  concluir  que  hay  una  diferencia  en  el  desgaste  medio  para  llantas  tipo  A  y  B. 


CONSEJO 


Los  intervalos  de  confianza 
siempre  se  interpretan  en  la 
misma  forma.  En  muestreo 
repetido,  los  intervalos 
construidos  de  este  modo 
encierran  el  verdadero 
valor  del  parametro 
100(1  —  a)%  del  tiempo. 


Encuentre  un  intervalo  de  confianza  de  95%  para  (/j,1  —  i±2)  =  fxd  usando  los  datos  de 
la  tabla  10.3. 

Solucion  Un  intervalo  de  confianza  de  95%  para  la  diferencia  entre  los  niveles 
medios  de  desgaste  es 

~d  ±  tal2{vn 

.48  ±  2.776^^ 

.48  ±  .10 

o  sea  .38  <  (/jl,  —  /jl2)  <  .58.  Como  se  compara  el  ancho  de  este  intervalo  con  el  ancho 
de  un  intervalo  que  pudiera  haberse  construido  si  se  hubiera  disenado  el  experimento  en 
forma  no  pareada?  Es  probable  que  hubiera  sido  de  la  misma  magnitud  que  el  intervalo 
calculado  en  la  figura  10.14,  donde  los  datos  observados  fueron  incorrectamente  analiza- 
dos  usando  el  analisis  no  pareado.  Este  intervalo,  — 1.45  <  (/j.,  —  /jl2)  <  2.41,  es  mucho 
mas  ancho  que  el  intervalo  pareado,  lo  cual  indica  que  el  diseno  de  diferencia  pareada 
aumento  la  precision  de  nuestra  estimacion  y  hemos  obtenido  valiosa  informacion  con  el 
uso  de  este  diseno. 


La  prueba  de  diferencia  pareada  o  diseno  de  pares  acoplados  empleados  en  el  expe¬ 
rimento  de  desgaste  de  llantas  es  un  ejemplo  sencillo  de  un  diseno  experimental  deno- 
minado  diseno  de  bloque  aleatorizado. 
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CONSEJO 

Prueba  de  diferencia  pareada: 


df=  n  —  1. 


Cuando  hay  gran  cantidad  de  variabilidad  entre  las  unidades  experimentales,  aun  antes 
de  ponerse  en  practica  ningun  procedimiento  experimental,  el  efecto  de  esta  variabi¬ 
lidad  se  puede  reducir  al  mmimo  al  bloquear,  es  decir,  comparar  los  diferentes  proce- 
dimientos  dentro  de  grupos  de  unidades  experimentales  relativamente  similares  llama- 
das  bloques.  De  este  modo,  el  “ruido”  causado  por  la  gran  variabilidad  no  oculta  las 
verdaderas  diferencias  entre  los  procedimientos.  En  el  capitulo  1 1  analizaremos  con 
mas  detalle  los  disenos  aleatorizados  de  bloque. 

Es  importante  que  recuerde  que  el  pareo  o  bloqueo  se  presenta  cuando  se  planea  el 
experimento  y  no  despues  de  recolectar  los  datos.  Un  experimentador  puede  escoger 
usar  pares  de  gemelos  identicos  para  comparar  dos  metodos  de  aprendizaje.  Un  medico 
puede  registrar  la  presion  sanguinea  de  un  paciente  antes  y  despues  de  administrar  un 
medicamento  en  particular.  Una  vez  que  usted  haya  empleado  un  diseno  pareado  para 
un  experimento,  ya  no  tiene  oportunidad  de  usar  el  analisis  pareado  de  la  seccion  10.4. 
La  suposicion  de  independencia  ha  sido  violada  a  proposito  y  la  unica  opcion  es  usar  el 
analisis  pareado  descrito  aqui. 

Aun  cuando  hacer  un  pareado  fue  benefico  en  el  experimento  de  desgaste  de  llantas, 
este  puede  no  ser  siempre  el  caso.  En  el  analisis  pareado,  los  grados  de  libertad  para 
la  prueba  t  se  cortan  a  la  mitad,  es  decir,  de  ( n  +  n  —  2)  =  2 (n  —  1)  a  (n  —  1).  Esta 
reduccion  aumenta  el  valor  critico  de  t  para  rechazar  H0  y  tambien  aumenta  el  ancho  del 
intervalo  de  confianza  para  la  diferencia  en  las  dos  medias.  Si  el  pareado  no  es  eficiente, 
este  aumento  no  es  compensado  por  una  disminucion  en  la  variabilidad  y  de  hecho  se 
puede  perder  y  no  ganar  information  por  el  pareado.  Esto  por  supuesto  que  no  ocurrio 
en  todo  el  experimento,  ya  que  la  reduccion  grande  en  el  error  estandar  compenso  la 
perdida  en  grados  de  libertad. 

Excepto  por  la  notation,  el  analisis  de  diferencia  pareada  es  igual  que  el  analisis  de 
una  sola  muestra  presentado  en  la  seccion  10.3.  No  obstante,  MINITAB  da  un  solo  proce¬ 
dimiento  llamado  Paired  t  para  analizar  las  diferencias,  como  se  ve  en  la  figura  10.15. 
El  valor  p  para  el  analisis  pareado,  .000,  indica  una  diferencia  altamente  significativa  en 
las  medias.  Usted  encontrara  instrucciones  para  generar  esta  salida  impresa  MINITAB 
en  la  seccion  “Mi  MINITAB ”  al  final  de  este  capitulo. 


FIGURA  1  0.1  5 

Salida  impresa  MINITAB 
para  analisis  de  diferen¬ 
cia  pareada  de  datos  del 
desgaste  de  llantas 


Prueba  T  pareada  y  Cl:  Manta  A,  Manta  B 


Paired 

T  for 

Tire  A  -  Tire 

B 

N 

Mean 

StDev 

SE  Mean 

Tire  A 

5 

10.240 

1 .316 

0 . 589 

Tire  B 

5 

9.760 

1 . 328 

0 . 594 

Difference 

5 

0.4800 

0 . 0837 

0 . 0374 

95%  Cl 

for  mean  difference 

:  (0.3761,  0 

.5839) 

T-Test 

of  mean  difference  = 

=  0  (vs  not 

=  0) :  T-Value  =  12.83  P-Value 

© 


EJERCICIOS 


TECNICAS  BASICAS 


10.35  Se  realizo  un  experimento  de  diferencia  pareada 
usando  n  =  10  pares  de  observation. 

a.  Pruebe  la  hipotesis  nula  H0  :  (p,  —  /x2)  =  0  contra 
Ha  '■  (Mi  —  M2)  ^  0  para  a  =  .05,  d  =  .3  y  s2d  =  .16. 
De  el  valor  p  aproximado  para  la  prueba. 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para 
(Mi  -  M 2). 


('.Cuantos  pares  de  observaciones  se  necesitan  si  se 
desea  estimar  (/r  1  —  pu2)  correcta  a  no  mas  de  .1  con 
probabilidad  igual  a  .95? 

1 0.36  Un  experimento  de  diferencia  pareada  consta  de 
n  =  18  pares  d  =  5.7,  y  s2d  =  256.  Suponga  que  se  desea 
detectar  p.,,  >  0. 

a.  De  la  hipotesis  nula  y  alternativa  para  la  prueba. 

b.  Efectue  la  prueba  y  exprese  sus  conclusiones. 
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10.37  Se  realizo  un  experimento  de  diferencia  pareada 
para  comparar  las  medias  de  dos  poblaciones: 

Pares 

Poblacion  1  2  3  4  5 

1  1.3  1.6  1.1  1.4  1.7 

2  1.2  1.5  1.1  1.2  1.8 

a.  7,Los  datos  dan  suficiente  evidencia  para  indicar  que 
fjLi  difiere  de  /x2?  Pruebe  usando  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interprete  su  valor. 

c.  Encuentre  un  intervalo  de  confianza  de  95%  para 
(/r,i  —  /jb2).  Compare  su  interpretation  del  intervalo 
de  confianza  con  sus  resultados  de  la  prueba  en  el 
inciso  a). 

d.  i Que  suposiciones  se  deben  hacer  para  lograr  que  sus 
inferencias  sean  validas? 

APLICACIONES 

(^)datos  10.38  Seguros  de  autos  Elcostodel 
seguro  de  un  automovil  se  ha  convertido  en 
un  asunto  diffcil  en  California  debido  a  que  las  tasas 
dependen  de  tantas  variables,  por  ejemplo  la  ciudad  en 
donde  se  vive,  el  numero  de  autos  que  el  usuario  asegure 
y  la  companfa  con  la  que  se  asegure.  A  continuation 
veamos  las  primas  anuales  de  2006-2007  para  un  hombre 
soltero,  con  licencia  de  6-8  anos,  que  maneja  un  Honda 
Accord  12600  a  15000  millas  por  ano 
y  no  tiene  infracciones  ni  accidentes.10 


Ciudad 

Allstate 

21st  Century 

Long  Beach 

$2617 

$2228 

Pomona 

2305 

2098 

San  Bernardino 

2286 

2064 

Moreno  Valley 

2247 

1890 

Fuente:  www.insurance.ca.gov 

a.  (',Por  que  se  esperarfa  que  estos  pares  de  observaciones 
fueran  dependientes? 

b.  (',Los  datos  dan  suficiente  evidencia  para  indicar  que 
hay  una  diferencia  en  el  promedio  de  primas  anuales 
entre  seguros  Allstate  y  21st  Century?  Pruebe  usando 
a  =  .01. 

c.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interprete  su  valor. 

d.  Encuentre  un  intervalo  de  confianza  de  99%  para 
la  diferencia  en  el  promedio  de  primas  anuales  para 
seguros  Allstate  y  21st  Century. 

e.  ^Puede  usar  la  information  de  la  tabla  para  hacer 
comparaciones  validas  entre  seguros  Allstate  y  21st 
Century  en  todo  Estados  Unidos?  (:,Por  que  sf  o  por 
que  no? 


10.39  Corredores  y  ciclistas  II  Consulte  el  ejercicio 
10.26.  Ademas  de  las  presiones  del  compartimiento,  el 
nivel  de  creatina  fosfoquinasa  (CPK)  en  muestras  de 
sangre,  una  medida  del  dano  muscular,  se  determino 
para  cada  uno  de  los  10  corredores  y  10  ciclistas  antes 
y  despues  del  ejercicio.1 2 3 4 * * 7  El  resumen  de  datos,  es  decir, 
valores  de  CPK  en  unidades/litro,  es  como  sigue: 


Afeccion 

Corredores 

Ciclistas 

Media 

Desviacion 

estandar 

Media 

Desviacion 

estandar 

Antes  de  ejercicio 

255.63 

115.48 

173.8 

60.69 

Despues  de  ejercicio 

284.75 

132.64 

177.1 

64.53 

Diferencia 

29.13 

21.01 

3.3 

6.85 

a.  Pruebe  para  una  diferencia  significativa  en  valores  medios 
de  CPK  para  corredores  y  ciclistas  antes  del  ejercicio, 
bajo  la  suposicion  de  que  a]  A  ar\\  use  a  =  .05. 
Encuentre  una  estimation  de  intervalo  de  confianza  de 
95%  para  la  correspondiente  diferencia  en  medias. 

b.  Pruebe  para  una  diferencia  significativa  en  valores  medios 
de  CPK  para  corredores  y  ciclistas  despues  del  ejercicio, 
bajo  la  suposicion  de  que  ar\  A  a\;  use  a  =  .05. 
Encuentre  una  estimation  de  intervalo  de  confianza  de 
95%  para  la  correspondiente  diferencia  en  medias. 

c.  Pruebe  para  una  diferencia  significativa  en  valores 
medios  de  CPK  para  corredores  antes  y  despues  del 
ejercicio. 

d.  Encuentre  un  intervalo  de  confianza  de  95% 
estimado  para  la  diferencia  en  la  media  de  los 
valores  de  CPK  para  los  ciclistas  antes  y  despues 
del  ejercicio.  ^Su  estimation  indica  que  no  hay 
diferencia  significativa  en  niveles  medios  de  CPK 
para  ciclistas  antes  y  despues  del  ejercicio? 

(^)  datos  10.40  Canasta  de  mercado  de  Estados 
ex 1 040  Unidos  Un  anuncio  para  Albertsons,  una 

cadena  de  supermercados  del  oeste  de  Estados  Unidos, 
dice  que  Albertsons  habfa  tenido  precios  consistentemente 
mas  bajos  que  otros  cuatro  supermercados  de  servicio 
completo.  Como  parte  de  una  encuesta  realizada  por  una 
“companfa  independiente  de  revision  de  precios  de  la 
canasta  de  mercado”,  el  promedio  total  semanal,  con  base 
en  los  precios  de  alrededor  de  95  artfculos,  se  da  para  dos 
cadenas  diferentes  de  supermercados  registrados  durante 
semanas  consecutivas  en  un  mes  en  particular. 

Semana  Albertsons  Ralphs 

1  254.26  256.03 

2  240.62  255.65 

3  231.90  255.12 

4  234.13  261.18 

a.  7,Hay  una  diferencia  significativa  en  los  precios 

promedio  para  estas  dos  cadenas  diferentes  de 
supermercados? 

b.  (,Cual  es  el  valor  p  aproximado  para  la  prueba 
realizada  en  el  inciso  a)? 
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c.  Construya  un  intervalo  de  confianza  de  99%  para 
la  diferencia  en  los  precios  promedio  para  las  dos 
cadenas  de  supermercados.  Interprete  este  intervalo. 

(^)datos  10.41  No  vuelta  a  la  izquierda  Serealizo 
un  experimento  para  comparar  los  tiempos 
medios  de  reaccion  a  dos  tipos  de  senalamientos 
de  transito:  restrictivos  (no  vuelta  a  la  izquierda)  y 
preventives  (solo  vuelta  a  la  izquierda).  Diez  conductores 
se  incluyeron  en  el  experimento.  A  cada  uno  se  le 
presentaron  40  senalamientos  de  transito,  20  restrictivos 
y  20  preventivos,  en  forma  aleatoria.  El  tiempo  medio 
de  reaccion  y  el  numero  de  acciones  correctas  se  registro 
para  cada  conductor.  Los  tiempos  medios  de  reaccion 
(en  milisegundos)  a  los  20  senalamientos  restrictivos  y 
20  preventivos  se  muestran  aqui  para  cada  uno  de  los  10 
conductores: 


Conductor 

Restrictivos 

Preventivos 

1 

824 

702 

2 

866 

725 

3 

841 

744 

4 

770 

663 

5 

829 

792 

6 

764 

708 

7 

857 

747 

8 

831 

685 

9 

846 

742 

10 

759 

610 

a.  Explique  por  que  es  un  experimento  de  diferencia 
pareada;  de  razones  por  las  que  el  pareado  debe  ser 
util  al  aumentar  information  sobre  la  diferencia  entre 
los  tiempos  medios  de  reaccion  a  senalamientos  de 
transito  restrictivos  y  preventivos. 

b.  i,  Estos  datos  presentan  suficiente  evidencia  para 
indicar  una  diferencia  en  tiempos  medios  de  reaccion 
a  senalamientos  de  transito  restrictivos  y  preventivos? 
Use  el  metodo  del  valor  p. 

c.  Encuentre  un  intervalo  de  confianza  de  95%  para 
la  diferencia  en  tiempos  medios  de  reaccion  a 
senalamientos  de  transito  restrictivos  y  preventivos. 

10.42  Dientes  sanos  I'  El  ejercicio  10.24  describe 
un  experimento  dental  realizado  para  investigar  la 
efectividad  de  un  enjuague  oral  empleado  para  inhibir 
el  crecimiento  de  placa  en  los  dientes.  Unas  personas  se 
dividieron  en  dos  grupos:  un  grupo  uso  un  enjuague  con 
un  ingrediente  antiplaca  y  el  grupo  de  control  uso  un 
enjuague  que  contenia  ingredientes  inactivos.  Suponga 
que  el  crecimiento  de  placa  en  los  dientes  de  cada 
persona  se  midio  luego  de  usar  el  enjuague  despues  de 
4  horas  y  ademas  otra  vez  despues  de  8  horas.  Si  usted 
desea  estimar  la  diferencia  en  crecimiento  de  placa  de  4 
a  8  horas,  /,debe  usar  un  intervalo  de  confianza  basado  en 
un  analisis  pareado  o  no  pareado?  Explique. 


10.43  ^Tierra  o  aire?  La  temperatura  de  la  tierra 
(que  afecta  la  germination  de  semillas,  el  crecimiento  de 
cosechas  en  mal  clima  y  muchos  aspectos  de  production 
agricola)  se  puede  medir  usando  ya  sea  sensores  al  nivel 
del  suelo  o  aparatos  sensibles  a  rayos  infrarrojos  instalados 
en  aviones  o  satelites  espaciales.  Los  sensores  instalados  en 
tierra  son  tediosos  y  requieren  numerosas  replicas  para 
obtener  una  estimation  precisa  de  la  temperatura  del  suelo. 
Por  otro  lado,  los  sensores  de  ondas  infrarrojas  instalados 
en  aviones  o  satelites  parecen  introducir  un  sesgo  en 
las  lecturas  de  temperatura.  Para  determinar  el  sesgo,  se 
obtuvieron  lecturas  en  cinco  lugares  diferentes  usando 
sensores  tanto  en  tierra  como  en  aviones.  Las  lecturas  (en 
grados  Celsius)  son  como  sigue: 

Lugar  Tierra  Aire 

1  46.9  47.3 

2  45.4  48.1 

3  36.3  37.9 

4  31.0  32.7 

5  24.7  26.2 

a.  (:,Los  datos  presentan  suficiente  evidencia  para  indicar 
un  sesgo  en  las  lecturas  de  temperatura  basadas  en 
aviones?  Explique. 

b.  Estime  la  diferencia  en  temperaturas  medias  entre 
sensores  basados  en  tierra  y  aire  usando  un  intervalo 
de  confianza  de  95%. 

c.  7,  Cu  ant  as  observaciones  pareadas  se  requieren  para 
estimar  la  diferencia  entre  temperatures  medias 
para  sensores  basados  en  tierra  contra  los  basados 
en  aire,  correcta  a  no  mas  de  .2°C,  con  probabilidad 
aproximadamente  igual  a  .95? 

datos  10.44  Tintura  roja  Para  probar  el  color 
comparativo  de  dos  tinturas  rojas,  se  tomaron 
nueve  muestras  de  tela  de  una  linea  de  production  y  cada 
muestra  se  dividio  en  dos  piezas.  Una  de  las  dos  piezas 
de  cada  muestra  se  escogio  al  azar  y  se  aplico  la  tintura 
roja  1;  la  tintura  roja  2  se  aplico  a  la  pieza  restante.  Los 
datos  siguientes  representan  una  “calificacion  de  color” 
para  cada  pieza. H ay  suficiente  evidencia  para  indicar 
una  diferencia  en  calificacion  media  de  color  para  las  dos 
tinturas?  Use  a  =  .05. 

Muestra  1  23  45678  9 

Tintura  1  10  12  9  8  15  12  9  10  15 

Tintura  2  8  11  10  6  12  13  9  8  13 

(^)datos  10.45  Asesores  de  impuestos  En 

respuesta  a  una  queja  de  que  un  asesor  de 
impuestos  en  particular  (A)  estaba  sesgado,  se  realizo  un 
experimento  para  comparar  al  asesor  citado  en  la  queja 
con  otro  asesor  de  impuestos  (B)  de  la  misma  oficina.  Se 
seleccionaron  ocho  propiedades  y  cada  una  fue  evaluada 
para  ambos  asesores.  Las  evaluaciones  (en  miles  de 
dolares)  se  muestran  en  la  tabla. 


www.FreeLibros.me 


10.6  INFERENCIAS  RESPECTO  A  LA  VARIANZA  POBLACIONAL  O  417 


Propiedad 

Asesor A 

Asesor  B 

1 

76.3 

75.1 

2 

88.4 

86.8 

3 

80.2 

77.3 

4 

94.7 

90.6 

5 

68.7 

69.1 

6 

82.8 

81.0 

7 

76.1 

75.3 

8 

79.0 

79.1 

Use  la  salida  impresa  MINITAB  para  contestar  las  preguntas. 
Salida  impresa  MINITAB  para  el  ejercicio  10.45 


Prueba  T  pareada  y  Cl:  asesor  A,  asesor  B 

Paired  T  for 

Assessor  A  - 

Assessor  B 

N 

Mean 

StDev  SE 

Mean 

Assessor  A 

8 

80 . 77 

7.99 

2 . 83 

Assessor  B 

8 

79.29 

6 . 85 

2 .42 

Difference 

8 

1.488 

1.491 

0 . 527 

95%  lower  bound 

for  mean 

difference:  0.489 

T-Test  of  mean 

difference 

=  0  (vs  >  0)  : 

T-Value  =  2. 

82 

P-value  = 

0 . 013 

a.  pLos  datos  dan  suficiente  evidencia  para  indicar  que 
el  asesor  A  tiende  a  dar  evaluaciones  mas  altas  que  el 
asesor  B? 

b.  Estime  la  diferencia  en  evaluaciones  medias  para  los 
dos  asesores. 

c.  pQue  suposiciones  deben  hacerse  para  que  las 
inferencias  en  los  incisos  a)  y  b)  sean  validas? 

d.  Suponga  que  el  asesor  A  habfa  sido  comparado  con 
un  estandar  mas  estable,  es  decir,  el  promedio  x  de  las 
evaluaciones  dadas  por  cuatro  asesores  seleccionados 
de  la  oficina  de  impuestos.  Asf,  cada  propiedad  serfa 
evaluada  por  A  y  tambien  por  cada  uno  de  los  otros 
cuatro  asesores  y  (xA  —  x)  se  calcularfa.  Si  la  prueba 
del  inciso  a)  es  valida,  ^puede  usted  usar  la  prueba  t  de 
diferencia  pareada  para  probar  la  hipotesis  de  que  el 
sesgo,  la  diferencia  media  entre  las  evaluaciones  de 
A  y  la  media  de  las  evaluaciones  de  los  otros  cuatro 
asesores,  es  igual  a  0?  Explique. 


(|2||)datos  10.46  Experimentos  de  memoria  Un 

grupo  de  psicologfa  realizo  un  experimento 
para  comparar  si  una  calificacion  de  recordatorio,  en 
la  que  se  dieron  instrucciones  para  formar  imagenes 
de  25  palabras,  es  mejor  que  una  calificacion  inicial  de 
recordatorio  para  la  cual  no  se  dieron  instrucciones  para 
formar  imagenes.  Veinte  estudiantes  participaron  en  el 
experimento  con  los  resultados  siguientes: 


Con  Sin 

Estudiante  imagenes  imagenes 

Con 

Estudiante  imagenes 

Sin 

imagenes 

1 

20 

5 

11 

17 

8 

2 

24 

9 

12 

20 

16 

3 

20 

5 

13 

20 

10 

4 

18 

9 

14 

16 

12 

5 

22 

6 

15 

24 

7 

6 

19 

11 

16 

22 

9 

7 

20 

8 

17 

25 

21 

8 

19 

11 

18 

21 

14 

9 

17 

7 

19 

19 

12 

10 

21 

9 

20 

23 

13 

gLe  parece  que  el  promedio  de  calificaciones  de 
recordatorio  es  mas  alto  cuando  se  usan  imagenes? 

datos  10.47  Vlusica  en  el  trabajo  Antes  de 
contratar  la  instalacion  de  musica  estereo 
transmitida  a  cada  una  de  sus  habitaciones  de  oficinas,  un 
ejecutivo  hizo  que  su  gerente  de  oficinas  seleccionara  al 
azar  siete  oficinas  para  instalarles  el  sistema.  El  tiempo 
promedio  (en  minutos)  empleado  fuera  de  estas  oficinas, 
por  salidas  de  los  empleados  involucrados,  se  registro 
antes  y  despues  de  instalar  el  sistema  de  musica  con  los 
siguientes  resultados: 

Numero  de  oficina  1  2  3  4  5  6  7 

No  musica  8  9  5  6  5  10  7 

Con  musica  5  6  7  5  6  7  8 

('.Sugerina  usted  que  el  ejecutivo  proceda  con  la 
instalacion?  Realice  una  prueba  apropiada  de  hipotesis. 
Encuentre  el  valor  p  aproximado  e  interprete  sus 
resultados. 


INFERENCIAS  RESPECTO 
A  LA  VARIANZA  POBLACIONAL 

Ya  hemos  visto  en  las  secciones  precedentes  que  una  estimacion  de  la  varianza  pobla- 
cional  a2  suele  ser  necesaria  antes  de  hacer  inferencias  acerca  de  medias  poblacionales, 
pero  a  veces  la  varianza  poblacional  cr2  es  el  objetivo  principal  en  una  investigation 
experimental.  Puede  ser  mas  importante  para  el  experimentador  que  la  media  poblacio¬ 
nal.  Considere  estos  ejemplos: 


•  Los  instrumentos  de  mediciones  cientificas  deben  dar  lecturas  no  sesgadas  con 
un  muy  pequeno  error  de  medicion.  Un  altfmetro  de  un  avion  que  mida  la  altitud 
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correcta  en  promedio  es  bastante  inutil  si  las  mediciones  estan  en  error  de  hasta  1000 
pies  arriba  o  debajo  de  la  altitud  correcta. 

•  Las  piezas  maquinadas  en  un  proceso  de  manufacture  deben  ser  producidas  con 
minima  variabilidad  para  reducir  piezas  fuera  de  dimensiones  y,  por  tanto,  defec- 
tuosas. 

•  Las  pruebas  de  aptitud  deben  estar  disenadas  de  manera  que  las  calificaciones 

ex hibiran  una  cantidad  razonable  de  variabilidad.  Por  ejemplo,  un  examen  de  800 
puntos  no  es  muy  discriminatorio  si  todos  los  estudiantes  obtienen  calificaciones 
entre  601  y  605. 

En  capitulos  previos,  hemos  usado 
2  {xx  -  x)2 

S  =  - ] - 

n  —  1 

como  estimador  insesgado  de  la  varianza  poblacional  cr2.  Esto  significa  que,  en  muestreo 
repetido,  el  promedio  de  todas  las  estimaciones  muestrales  sera  igual  al  parametro  obje- 
tivo,  cr2.  Pero,  <■  t|iie  tan  cercano  o  lejano  del  objetivo  es  probable  que  este  su  estimador 
,v2?  Para  contestar  esta  pregunta,  usamos  la  distribucion  de  muestreo  de  .v2.  que  describe 
su  comportamiento  en  muestreo  repetido. 

Considere  la  distribucion  de  s2  basada  en  muestreo  aleatorio  repetido  de  una  distribu¬ 
cion  normal  con  una  media  y  varianza  especificadas.  Podemos  demostrar  teoricamente 
que  la  distribucion  empieza  en  j2  =  0  (porque  la  varianza  no  puede  ser  negativa)  con  una 
media  igual  a  cr2.  Su  forma  es  no  simetrica  y  cambia  con  cada  tamano  muestral  diferente 
y  cada  valor  diferente  de  cr2.  Hallar  valores  criticos  para  la  distribucion  de  muestreo  de 
,v2  serfa  muy  dificil  y  requerirfa  tablas  separadas  para  cada  varianza  poblacional.  Por 
fortuna,  podemos  simplificar  el  problema  por  estandarizacion,  como  hicimos  con  la 
distribucion  z. 


Definicion  La  estadistica  estandarizada 

2  _  (n  ~  1)J2 
X  a2 

recibe  el  nombre  de  variable  ji  cuadrada  y  tiene  una  distribucion  de  muestreo  llamada 

distribucion  de  probabilidad  ji  cuadrada,  con  n  —  1  grados  de  libertad. 


La  ecuacion  de  la  funcion  de  densidad  para  esta  estadistica  es  por  demas  complicada  al 
verla,  pero  traza  la  curva  que  se  ve  en  la  figure  10.16. 


FIGURA  10.16 

Distribucion  ji  cuadrada 


X 


2 


Ciertos  valores  criticos  de  la  estadistica  ji  cuadrada,  que  se  usan  para  hacer  inferencias 
acerca  de  la  varianza  poblacional,  han  sido  tabulados  por  estadisticos  y  aparecen  en  la 
tabla  5  del  apendice  I.  Como  la  forma  de  la  distribucion  varfa  con  el  tamano  muestral  n, 
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mas  precisamente.  los  grados  de  libertad,  n  —  1,  asociados  con  s2,  tabla  5,  parcialmente 
reproducidos  en  la  tabla  10.5,  se  construye  exactamente  en  la  misma  forma  que  la  tabla 
t,  con  los  grados  de  libertad  en  la  primera  y  ultima  columnas.  El  sfmbolo  xf  indica  que 
el  valor  X  tabulado  tiene  un  area  a  a  su  derecha  (vease  la  figura  10.16). 


tabla  10.5  Formato  de  la  tabla  ji  cuadrada  de  la  tabla  5  del  apendice  I 


df 

2 

X  .995 

_  2 

X  .950 

2 

X  .900 

2 

X  .loo 

2 

X  .050 

2 

X  .005 

df 

1 

.0000393 

.0039321 

.0157908 

2.70554 

3.84146 

7.87944 

1 

2 

.0100251 

.102587 

.210720 

4.60517 

5.99147 

10.5966 

2 

3 

.0717212 

.351846 

.584375 

6.25139 

7.81473 

12.8381 

3 

4 

.206990 

.710721 

1 .063623 

7.77944 

9.48773 

14.8602 

4 

/^v  _ - _ 

5 

.411740 

1.145476 

1.610310 

9.23635 

1 1 .0705 

16.7496 

5 

CONSEJO 

6 

.0675727 

1.63539 

2.204130 

10.6446 

12.5916 

18.5476 

6 

Probando  una  varianza: 

df=  n  —  1. 

15 

4.60094 

7.26094 

8.54675 

22.3072 

24.9958 

32.8013 

15 

16 

5.14224 

7.96164 

9.31223 

23.5418 

26.2962 

34.2672 

16 

17 

5.69724 

8.67176 

10.0852 

24.7690 

27.5871 

35.7185 

17 

18 

6.26481 

9.39046 

10.8649 

25.9894 

28.8693 

37.1564 

18 

19 

6.84398 

10.1170 

11.6509 

27.2036 

30.1435 

38.5822 

19 

Se  puede  ver  en  la  tabla  10.5  que,  debido  a  que  la  distribucion  no  es  simetrica  y 
empieza  en  0,  las  areas  de  cola  superior  e  inferior  deben  ser  tabuladas  para  la  estadis- 
tica  ji  cuadrada.  Por  ejemplo,  el  valor  x2.95  es  el  valor  que  tiene  95%  del  area  bajo  la 
curva  a  su  derecha  y  5%  del  area  a  su  izquierda.  Este  valor  corta  un  area  igual  a  .05  en 
la  cola  inferior  de  la  distribucion  ji  cuadrada. 

Pruebe  su  capacidad  para  usar  la  tabla  5  del  apendice  I  al  verificar  las  siguientes  frases: 

1.  La  probabilidad  de  que  )(,  basada  en  n  =  16  mediciones  (df  =  15),  exceda  de 
24.9958  es  .05. 

2.  Para  una  muestra  de  n  =  6  mediciones,  95%  del  area  bajo  la  distribucion  x  estfi 
a  la  derecha  de  1.145476. 


Estos  valores  estan  sombreados  en  la  tabla  10.5. 


Se  puede  usar  el  applet  Chi-Square  Probabilities  (Probabilidades  Ji-cuadrada) 

para  hallar  el  valor  X  descrito  en  el  ejemplo  10.10.  Como  el  applet  da  valores  X  y 
sus  probabilidades  de  una  cola  para  los  grados  de  libertad  que  el  usuario  seleccione 
usando  el  cursor  de  la  derecha  del  applet,  se  debe  escoger  df=  5  y  teclear  .95  en  la 
caja  marcada  “prob:”  parte  en  la  parte  inferior  del  applet.  Este  dara  el  valor  de  ~x  que 
pone  .95  en  la  cola  derecha  de  la  distribucion  X  y  Por  tanto  .05  en  la  cola  izquierda. 
El  applet  de  la  figura  10.17  muestra  X  =  1.14,  que  difiere  solo  ligeramente  respecto 
del  valor  del  ejemplo  10.10.  Usaremos  este  applet  para  los  ejercicios  Mi  Applet  del 
final  de  este  capitulo. 
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FIGURA  10.17 

Applet  Chi-Square 
Probabilities 


Chi 


SqpT 


14 


Prob 


0.95 


J 


d 


La  prueba  estadfstica  de  una  hipotesis  nula  respecto  a  una  varianza  poblacional 
H0:a2  =  a20 

usa  el  estadfstico  de  prueba 

2  =  (»  ~  l)^2 
X  2 

Vo 

Observe  que  cuando  H0  es  verdadera,  s/a\  debe  ser  cercana  a  1,  de  modo  que  debe 
ser  cercana  a  (n  —  1),  los  grados  de  libertad.  Si  cr2  es  realmente  mayor  que  el  valor  hipo- 
tetico  (To,  el  estadfstico  de  prueba  tendera  a  ser  mayor  a  (n  —  1)  y  es  probable  que  caiga 
hacia  la  cola  superior  de  la  distribucion.  Si  cr2  <  cr20,  el  estadfstico  de  prueba  tendera  a 
ser  menor  a  (n  —  1)  y  es  probable  que  caiga  hacia  la  cola  inferior  de  la  distribucion  ji 
cuadrada.  A1  igual  que  en  otras  situaciones  de  prueba,  se  puede  usar  una  prueba  estadfs¬ 
tica  ya  sea  de  una  o  de  dos  colas,  dependiendo  de  la  hipotesis  alternativa.  Esta  prueba 
de  hipotesis  y  el  intervalo  de  confianza  (1  —  a)  100%  para  cr2  estan  basados  ambos  en  la 
distribucion  ji  cuadrada  y  se  describen  a  continuacion. 


PRUEBA  DE  HIPOTESIS  RESPECTO 
A  UNA  VARIANZA  POBLACIONAL 

1 .  Hipotesis  nula:  H0:  cr2  =  a20 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

Ha:  a2  >  a20  :  cr2  #  cr\ 

(o  Ha\  a2  <  cr20) 

3.  Estadfstico  de  prueba:  \2  =  — — 

&  0 
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4.  Region  de  rechazo:  rechazar  H0  cuando 

Prueba  de  una  cola 

X  >Xa 

(o  \2  <  X^i-a)  cuando  la  hipotesis 
alternativa  sea  Ha :  a2  <  a20),  donde 
Xa  y  X 2 !  q) son .  respectivamente,  los 
valores  de  cola  superior  e  inferior  de 
X2  que  pone  a  en  las  areas  de  cola. 

o  cuando  valor  p  <  a 


Prueba  de  dos  colas 

X2  >  X2a!2  0  X2  < 

donde  xla  y  x\i-am  s°ri 
respectivamente,  los 
valores  de  cola  superior 
e  inferior  de  x 2  que  pone 
a! 2  en  las  areas  de  cola 


Los  valores  crfticos  de  x  estan  basados  en  (n  —  1)  df.  Estos  valores  tabulados  se 
pueden  hallar  usando  la  tabla  5  del  apendice  I  o  el  applet  Chi-Square  Probabilities. 


INTERVALO  DE  CONFIANZA  DE  (1  -  «)100%  PARA  a2 

( n  ~  1)52  ^  2  ^  (n  -  1>2 

2  ^  2 
X  a/2  X  (1  — a/2 

donde  x2an  y  Xa-o/2)  son  l°s  val()rcs  X2-  que  localizan  la  mitad  de  a  en  cada  cola  de 
la  distribucion  ji  cuadrada. 

Suposicion:  La  muestra  se  selecciona  al  azar  de  una  poblacion  normal. 


Un  fabricante  de  cemento  dice  que  el  concreto  preparado  con  el  producto  de  el  tiene 
resistencia  relativamente  estable  a  la  compresion  y  que  la  resistencia  medida  en  kilo- 
gramos  por  centimetro  cuadrado  (kg/cm2)  esta  dentro  de  un  rango  de  40  kg/cm2.  Una 
muestra  de  n  =  10  mediciones  produjo  una  media  y  varianza  igual  a,  respectivamente, 

x  =  312  y  s2=  195 

Estos  datos  presentan  suficiente  evidencia  para  rechazar  lo  dicho  por  el  fabricante? 

Solucion  En  la  seccion  2.5,  usted  aprendio  que  el  rango  de  un  conjunto  de  medicio¬ 
nes  debe  ser  aproximadamente  cuatro  desviaciones  estandar.  Lo  dicho  por  el  fabricante 
de  que  el  rango  de  las  mediciones  de  resistencia  esta  dentro  de  40  kg/cm2  debe  significar 
que  la  desviacion  estandar  de  las  mediciones  es  casi  10  kg/cm3  o  menos.  Para  probar  su 
dicho,  las  hipotesis  apropiadas  son 

H0:a2  =  102  =  100  contra  Ha:a2>  100 


Si  la  varianza  muestral  es  mucho  mayor  que  el  valor  hipotetico  de  100,  entonces  el  esta- 
distico  de  prueba 


2  _  (n  ~  1> 

A 


o-o 


1755 

100 


=  17.55 


sera  inusualmente  grande,  favoreciendo  el  rechazo  de  H0  y  aceptacion  de  Hr  Hay  dos 
formas  de  usar  la  estadistica  de  prueba  para  tomar  una  decision  para  esta  prueba. 
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•  El  metodo  del  valor  critico:  La  prueba  apropiada  requiere  una  region  de  rechazo 
de  una  cola  en  la  cola  derecha  de  la  distribucion  X-  El  valor  critico  para 
a  =  .05  y  (n  —  1)  =  9  dfe, s  x\s  =  16.9190  de  la  tabla  5  en  el  apendice  I.  La 
figura  10.18  muestra  la  region  de  rechazo;  se  puede  rechazar  H0  si  el  estadlstico 
de  prueba  excede  de  16.9190.  Como  el  valor  observado  del  estadlstico  de  prueba 
X2  =  17.55,  se  puede  concluir  que  la  hipotesis  nula  es  falta  y  que  el  rango  de 
mediciones  de  resistencia  del  concreto  excede  de  lo  dicho  por  el  fabricante. 


FIGURA  10.18 

Region  de  rechazo  y  valor 
p(sombreado)  para  el 
ejemplo  10.11 


/  \ 

!  : 

0  16.9190  f 

;  19.0228 


Rechazar  Hq 


•  El  metodo  del  valor  p:  El  valor  p  para  una  prueba  estadlstica  es  el  mlnimo 
valor  de  a  para  el  cual  H0  puede  ser  rechazado.  Se  calcula,  al  igual  que  en  otras 
pruebas  de  una  cola,  como  el  area  en  la  cola  de  la  distribucion  x  a  la  derecha 
del  valor  observado,  x  =  17.55.  Aun  cuando  algunos  paquetes  de  computa- 
dora  permiten  calcular  esta  area  con  toda  exactitud,  la  tabla  5  del  apendice  I 
permite  solo  acotar  el  valor  p.  Como  el  valor  17.55  esta  entre  ^2050  =  16.9190 
y  X2.025  =  19.0228,  el  valor  p  esta  entre  .025  y  .05.  La  mayorfa  de  investigado- 
res  rechazarfan  H0  y  presentan  estos  resultados  como  significativos  al  nivel  de 
5%,  o  P  <  .05.  De  nueva  cuenta,  el  investigador  puede  rechazar  H0  y  concluir 
que  el  rango  de  mediciones  excede  de  lo  dicho  por  el  fabricante. 


Una  experimentadora  esta  convencida  de  que  su  instrumento  de  medicion  tenia  una 
variabilidad  medida  por  la  desviacion  estandar  a  =  2.  Durante  un  experimento,  ella 
registro  las  mediciones  4.1,  5.2  y  10.2.  y Estos  datos  confirman  o  desaprueban  lo  dicho 
por  ella?  Pruebe  la  hipotesis  apropiada  y  construya  un  intervalo  de  confianza  de  90% 
para  estimar  el  verdadero  valor  de  la  varianza  de  poblacion. 


Solucion  Como  no  hay  nivel  de  significance  establecido  de  antemano,  se  debe 
escoger  usar  el  metodo  del  valor  p  para  probar  estas  hipotesis: 

H0 :  a2  =  4  contra  Ha :  a2  A  4 

Use  su  calculadora  cientifica  para  verificar  que  la  varianza  muestral  es  s2  =  10.57  y  el 
estadlstico  de  prueba  es 

..2  (n  -  1)/  2(10.57)  c  ooc 

X  = - 2 - = - 7 - = 

cr  o  H 

Como  esta  es  una  prueba  de  dos  colas,  la  region  de  rechazo  se  divide  en  dos  partes,  la 
mitad  en  cada  cola  de  la  distribucion  X-  Si  se  aproxima  el  area  a  la  derecha  de  la  estadis- 
tica  de  prueba  observada,  x  =  5.285,  se  tendra  solo  la  mitad  del  valor  p  para  la  prueba. 
Como  un  valor  igualmente  improbable  de  x  podrfa  presentarse  en  la  cola  inferior  de  la 
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distribucion,  con  igual  probabilidad,  se  debe  duplicar  el  area  superior  para  obtener  el 
valor  p.  Con  2  df,  el  valor  observador,  5.29,  cae  entre  x2.io  y  ACos  de  modo  que 

.05  <  ^-(  valor/?)  <  .10  o  .10  <  valor/?  <  .20 

Como  el  valor  /?  es  mayor  a  .10,  los  resultados  no  son  estadfsticamente  significativos. 
Hay  insuficiente  evidencia  para  rechazar  la  hipotesis  nula  H0:  a2  =  4. 

El  correspondiente  intervalo  de  confianza  de  90%  es 

(n  ~  Y)s2  ^  _2  ^  (n  -  1  ).v2 
- 2 -  <(T  < 2 - 

X  all  X  (1  — a/2 

Los  valores  de  x'n-am  y  xln  son 
A'U-a/2)  =  X-95  =  .102587 
X2an  =  X205  =  5.99147 


Sustituyendo  estos  valores  en  la  formula  para  la  estimation  de  intervalo,  se  obtiene 

3.53  <  a2  <  206.07 


2(10.57)  <  <  2(10.57) 


5.99147 


.102587 


Asf,  se  puede  estimar  la  varianza  poblacional  para  que  caiga  en  el  intervalo  3.53  a  206.07. 
Este  intervalo  de  confianza  muy  ancho  indica  la  poca  informacion  sobre  la  varianza 
poblacional  que  se  obtiene  de  una  muestra  de  solo  tres  mediciones.  En  consecuencia, 
no  es  de  sorprenderse  que  haya  insuficiente  evidencia  para  rechazar  la  hipotesis  nula 
cr2  =  4.  Para  obtener  mas  informacion  sobre  a1,  el  experimentador  necesita  aumentar 
el  tamano  muestral. 


El  comando  MINITAB  Stat  — >  Basic  Statistics  — »  1  Variance  permite  introducir  datos  sin 
elaborar  o  un  resumen  de  estadfsticos  para  efectuar  la  prueba  F  para  una  sola  varianza,  y 
calcular  un  intervalo  de  confianza.  La  salida  impresa  MINITAB  correspondiente  al  ejem- 
plo  10.12  se  muestra  en  la  figura  10.19. 


FIGURA  10.19 

Salida  impresa  MINITAB 
para  el  ejemplo  10.12 


Chi-Square  Method  (Normal  Distribution) 

Variable  N  Variance  90%  Cl  Chi-Square  P 

Measurements  3  10.6  (3.5,  206.1)  5.28  0.142 


Q 


EJERCICIQS 


TECNICAS  BASICAS 


a.  Calcule  la  varianza  muestral,  s2 


10.48  Una  muestra  aleatoria  de  n  =  25  observaciones 
de  una  poblacion  normal  produjo  una  varianza  muestral 
igual  a  21.4.  /Estos  datos  dan  suficiente  evidencia  para 
indicar  que  cr2  >  15?  Pruebe  usando  a  =  .05. 

10.49  Una  muestra  aleatoria  de  n  =  15  observaciones 
fue  seleccionada  de  una  poblacion  normal.  La  media 
muestral  y  varianza  fueron  x  =  3.91  y  s2  =  .3214. 
Encuentre  un  intervalo  de  confianza  de  90%  para  la 
varianza  poblacional  cr2. 

10.50  Una  muestra  aleatoria  de  tamano  n  =  7  de  una 
poblacion  normal  produjo  estas  mediciones:  1.4,  3.6,  1.7, 
2.0,  3.3,  2.8,  2.9. 


b.  Construya  un  intervalo  de  confianza  de  95%  para  la 
varianza  poblacional,  cr2. 

c.  Pruebe  H0  :  cr2  =  .8  contra  //a :  a1  F  .8  usando 
a  =  .05.  Exprese  sus  conclusiones. 

d.  /Cual  es  el  valor  p  aproximado  para  la  prueba  del 
inciso  c)? 

APLICACIONES 

10.51  Precision  de  instrumentos  Uninstmmento 
de  precision  esta  garantizado  para  leer  con  precision 
con  variacion  de  no  mas  de  2  unidades.  Una  muestra  de 
cuatro  lecturas  de  instrumentos  en  el  mismo  objeto  dio  las 
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mediciones  353,  351,  351  y  355.  Pruebe  la  hipotesis  nula 
de  que  a  =  .7  contra  la  alternativa  de  cr  <  .7.  Use  a  =  .05. 

10.52  Precision  de  instrumentos,  continua 

Encuentre  un  intervalo  de  confianza  de  90%  para  la 
varianza  poblacional  del  ejercicio  10.51. 

10.53  Potencia  de  medicamentos  Para  pacientes 
tratados  debidamente,  los  medicamentos  prescritos  por 
medicos  deben  tener  una  potencia  que  sea  definida  con 
precision.  En  consecuencia,  los  valores  de  distribucion  de 
potencia  para  envfos  de  un  medicamento  no  solo  deben 
tener  un  valor  medio  como  se  especifica  en  el  envase  del 
medicamento,  sino  que  tambien  la  variacion  en  potencia 
debe  ser  pequena.  De  otro  modo,  los  farmaceuticos 
distribuirfan  recetas  que  serfan  peligrosamente  potentes 

o  tendrfan  una  baja  potencia  y  serfan  ineficaces.  Un 
fabricante  de  medicinas  dice  que  su  medicina  esta 
marcada  con  una  potencia  de  5  ±  .  1  miligramos  por 
centfmetro  cubico  (mg/cc).  Una  muestra  aleatoria  de 
cuatro  envases  dio  lecturas  de  potencia  iguales  a  4.94, 
5.09,  5.03  y  4.90  mg/cc. 

a.  i,Los  datos  presentan  suficiente  evidencia  para  indicar 
que  la  potencia  media  difiere  de  5  mg/cc? 

b.  (',Los  datos  presentan  suficiente  evidencia  para  indicar 
que  la  variacion  en  potencia  difiere  de  los  lfmites  de 
error  especificados  por  el  fabricante?  [sugerencia: 

A  veces  es  diffcil  determinar  con  exactitud  lo  que  se 
entiende  por  lfmites  de  potencia  especificados  por 
un  fabricante.  Como  este  implica  que  los  valores  de 
potencia  caeran  en  los  intervalos  5  ±  .  1  mg/cc  con 
muy  alta  probabilidad,  es  decir  que  la  implication  es 
siempre,  supongamos  que  el  rango  .2;  o  (4.9  a  5.1), 
representa  6cr,  como  lo  sugiere  la  Regia  Empfrica. 
Observe  que  hacer  que  el  rango  sea  igual  a  6cr  en  lugar 
de  4cr  pone  una  interpretation  rigurosa  en  lo  dicho  por 
el  fabricante.  Deseamos  que  la  potencia  caiga  en  el 
intervalo  5  ±  .  1  con  muy  alta  probabilidad.] 

10.54  Potencia  de  medicamentos,  continua 

Consulte  el  ejercicio  10.53.  La  prueba  de  60  envases  de 
medicamento  adicionales  seleccionados  al  azar  dio 
una  media  muestral  y  varianza  igual  a  5.04  y  .0063  (para 
el  total  de  n  =  64  envases).  Usando  un  intervalo  de 


confianza  de  95%,  estime  la  varianza  de  las  mediciones 
de  potencia  hechas  por  el  fabricante. 

10.55  Cascos  de  seguridad  Un  fabricante  de  cascos 
de  seguridad  para  trabajadores  de  la  construction,  esta 
preocupado  por  la  media  y  la  variacion  de  las  fuerzas 
que  transmiten  los  cascos  a  los  usuarios  cuando  son 
sometidos  a  una  fuerza  externa  estandar.  El  fabricante 
desea  que  la  fuerza  media  transmitida  por  cascos  sea  de 
800  libras  (o  menos),  muy  por  debajo  del  lfmite  legal 

de  1000  libras  y  que  cr  sea  menor  a  40.  Se  probo  una 
muestra  aleatoria  de  n  =  40  cascos  y  se  encontro  que  la 
media  y  varianza  muestrales  eran  iguales  a  825  libras  y 
2350  libras2,  respectivamente. 

a.  Si  p,  =  800  y  cr  =  40,  <',es  probable  que  cualquier 
casco,  sometido  a  la  fuerza  externa  estandar,  transmita 
una  fuerza  de  mas  de  1000  libras  al  usuario?  Explique. 

b.  ('.Los  datos  dan  suficiente  evidencia  para  indicar  que, 
cuando  los  casos  son  sometidos  a  la  fuerza  externa 
estandar,  la  fuerza  media  transmitida  por  los  cascos 
excede  de  800  libras? 

10.56  Cascos  de  seguridad,  continua  Consulte  el 
ejercicio  10.55.  ^Los  datos  dan  suficiente  evidencia  para 
indicar  que  cr  excede  de  40? 

datos  1 0.57  Focos  electricos  A  un  fabricante 
de  focos  electricos  industrials  le  gusta  que 
estos  tengan  una  vida  media  que  sea  aceptable  para  sus 
clientes,  ademas  de  tener  una  variacion  en  vida  que 
sea  relativamente  pequena.  Si  algunos  focos  se  funden 
demasiado  pronto  en  su  vida  util,  los  clientes  se  molestan 
y  cambian  a  productos  de  la  competencia.  Grandes 
variaciones  arriba  de  la  media  reducen  las  ventas  de 
repuestos  y  una  variacion  en  general  interrumpe  los 
programas  de  reposition  de  los  clientes.  Una  muestra  de 
20  focos  probados  produjo  las  siguientes  duraciones 
de  vida  util  (en  horas): 

2100  2302  1951  2067  2415  1883  2101  2146  2278  2019 

1924  2183  2077  2392  2286  2501  1946  2161  2253  1827 

El  fabricante  desea  controlar  la  variabilidad  en  duration 
de  vida  util  para  que  cr  se  menor  a  150  horas.  i Los  datos 
dan  suficiente  evidencia  para  indicar  que  el  fabricante 
esta  alcanzado  su  objetivo?  Pruebe  usando  a  =  .01. 


COMPARACION  DE  DOS  VARIANZAS 
POBLACIONALES 

Asf  como  una  sola  varianza  poblacional  a  veces  es  importante  para  un  experimentador, 
usted  tambien  necesita  comparar  dos  varianzas  poblacionales.  Puede  tener  que  compa- 
rar  la  precision  de  un  aparato  de  medicion  con  la  de  otro,  la  estabilidad  del  proceso  de 
manufactura  con  la  de  otro,  o  incluso  la  variabilidad  en  el  procedimiento  de  calificacio- 
nes  de  un  profesor  universitario  con  el  de  otro. 
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Una  forma  de  comparar  dos  varianzas  poblacionales,  cr2  y  cr2,  es  usar  la  razon  entre 
las  varianzas  muestrales,  s\/s\.  Si  s\/s\  es  casi  igual  a  1,  se  encuentra  poca  evidencia 
para  indicar  que  er2i  y  cr22  son  iguales.  Por  otra  parte,  un  valor  muy  grande  o  muy  peque- 
no  para  s]/.sl  da  evidencia  de  una  diferencia  en  las  varianzas  poblacionales. 

(;Que  tan  grande  debe  ser  para  que  haya  evidencia  suficiente  para  rechazar  la 
siguiente  hipotesis  nula? 

H0 :  a]  =  ar\ 

La  respuesta  a  esta  pregunta  puede  hallarse  al  estudiar  la  distribucion  de  s\ls\  en  un 
muestreo  repetido. 

Cuando  muestras  aleatorias  se  sacan  de  entre  dos  poblaciones  normales  con  varian¬ 
zas  iguales,  es  decir,  cr2  =  cr2;  entonces  s\/s\  tiene  una  distribucion  de  probabilidad  en 
un  muestreo  repetido  que  los  estadisticos  conocen  como  distribucion  F,  que  se  ilustra 
en  la  figura  10.20. 


CONSEJO 


Prueba  de  dos  varianzas: 
df,  =  n,  —  1  y 
df2  =  rii  —  1 


SUPOSICIONES  PARA  QUE  s\ls\  TENGA 
UNA  DISTRIBUCION  F 

•  Muestras  aleatorias  e  independientes  se  sacan  de  cada  una  de  dos  poblaciones 
normales. 

•  La  variabilidad  de  las  mediciones  en  las  dos  poblaciones  es  igual  y  puede  ser 
medida  por  una  varianza  comun,  cr2;  esto  es,  a]  =  cr2  =  cr2. 

No  es  importante  que  usted  conozca  la  ecuacion  compleja  de  la  funcion  de  densidad 
para  F.  Para  nuestros  fines,  solo  se  necesita  usar  los  valores  criticos  bien  tabulados  de  F 
dados  en  la  tabla  6  en  el  apendice  I. 

Los  valores  criticos  de  F  y  valores  p  para  pruebas  de  significancia  tambien  se  pueden 
hallar  usando  el  applet  F  Probabilities  (Probabilidades  F)  que  se  ve  en  la  figura  10.21. 

Al  igual  que  la  distribucion  )(,  la  forma  de  la  distribucion  F  es  no  simetrica  y 
depende  del  numero  de  grados  de  libertad  asociados  con  s]  y  ,v 22,  representados  como 
dfi  =  («!  —  1)  y  df2  =  (n2  —  1),  respectivamente.  Esto  complica  la  tabulacion  de  valo¬ 
res  criticos  de  la  distribucion  F  porque  se  requiere  de  una  tabla  para  cada  combinacion 
diferente  de  dfu  df2  y  a. 

En  la  tabla  6  del  apendice  I,  los  valores  criticos  de  F  para  areas  de  cola  derecha 
correspondientes  a  a  =  .100,  .050,  .025,  .010  y  .005  estan  tabulados  para  varias  com- 
binaciones  de  dfi  grados  de  libertad  del  numerador  y  df2  grados  de  libertad  del  deno- 
minador.  Una  parte  de  la  tabla  6  se  reproduce  en  la  tabla  10.6.  El  numero  de  grados 
de  libertad  df\  del  numerador  aparece  en  el  margen  superior  y  el  numero  de  grados  de 
libertad  del  denominador  df2  aparece  a  lo  largo  del  margen  lateral.  Los  valores  de  a  se 
encuentran  en  la  segunda  columna.  Para  una  combinacion  fija  de  df\  y  df2,  los  valores 
criticos  apropiados  de  F  se  encuentran  en  la  linea  indizada  por  el  valor  de  a  requerido. 
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FIGURA  10.21 

Applet  FProbabilities 


Compruebe  su  capacidad  para  usar  la  tabla  6  del  apendice  I  al  verificar  los  siguientes 
enunciados: 


1 .  El  valor  de  F  con  area  .05  a  su  derecha  para  dfi  =  6  y  df2  =  9  es  3.37. 

2.  El  valor  de  F  con  area  .05  a  su  derecha  para  df\=5ydf2  =  10  es  3.33 

3.  El  valor  de  F  con  area  .01  a  su  derecha  para  df\  =  6  y  df2  =  9  es  5.80. 

Estos  valores  estan  sombreados  en  la  tabla  10.6. 


TABLA  10.6 


Formato  para  la  tabla  Fde  la  tabla  6  del  apendice  1 

df, 

df2 

a 

1 

2 

3 

4 

5 

6 

1 

.100 

39.86 

49.50 

53.59 

55.83 

57.24 

58.20 

.050 

161.4 

199.5 

215.7 

224.6 

230.2 

234.0 

.025 

647.8 

799.5 

864.2 

899.6 

921.8 

937.1 

.010 

4052 

4999.5 

5403 

5625 

5764 

5859 

.005 

16211 

20000 

21615 

22500 

23056 

23437 

2 

.100 

8.53 

9.00 

9.16 

9.24 

9.29 

9.33 

.050 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

.025 

38.51 

39.00 

39.17 

39.25 

39.30 

39.33 

.010 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

.005 

198.5 

199.0 

199.2 

199.2 

199.3 

199.3 

3 

.100 

5.54 

5.46 

5.39 

5.34 

5.31 

5.28 

.050 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

.025 

17.44 

16.04 

15.44 

15.10 

14.88 

14.73 

.010 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

.005 

55.55 

49.80 

47.47 

46.19 

45.39 

44.84 

9 

.100 

3.36 

3.01 

2.81 

2.69 

2.61 

2.55 

.050 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

.025 

7.21 

5.71 

5.08 

4.72 

4.48 

4.32 

.010 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

.005 

13.61 

10.11 

8.72 

7.96 

7.47 

7.13 

10 

.100 

3.29 

2.92 

2.73 

2.61 

2.52 

2.46 

.050 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

.025 

6.94 

5.46 

4.83 

4.47 

4.24 

4.07 

.010 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

.005 

12.83 

9.43 

8.08 

7.34 

6.87 

6.54 
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La  prueba  estadfstica  de  la  hipotesis  nula 
Ho  '■  0"  i  =  cr  2 

utiliza  el  estadistico  de  prueba 


Cuando  la  hipotesis  alternativa  implica  una  prueba  de  una  cola,  esto  es, 

//a :  cr2!  >  cr\ 

se  puede  hallar  el  valor  critico  de  cola  derecha  para  rechazar  H0  directamente  de  la  tabla 
6  del  apendice  I,  pero,  cuando  la  hipotesis  alternativa  requiera  una  prueba  de  dos  colas, 
es  decir, 

H0 :  a]  #  a \ 


la  region  de  rechazo  se  divide  entre  las  colas  superior  e  inferior  de  la  distribution  F. 
Estos  valores  crfticos  de  cola  izquierda  no  se  dan  en  la  tabla  6  por  la  siguiente  razon: 
el  experimentador  esta  libre  de  decidir  a  cual  de  las  dos  poblaciones  llamar  “Poblacion 
1”.  Si  siempre  escoge  llamar  “Poblacion  1”  a  la  poblacion  con  la  varianza  muestral  mas 
grande ,  entonces  el  valor  observado  de  su  estadfstica  de  prueba  siempre  estara  en  la  cola 
derecha  de  la  distribution  F.  Aun  cuando  la  mitad  de  la  region  de  rechazo,  el  area  a/2 
a  su  izquierda,  estara  en  la  cola  inferior  de  la  distribution,  nunca  sera  necesario  usarla. 
Pero  recuerde  estos  puntos,  para  una  prueba  de  dos  colas: 

•  El  area  de  la  cola  derecha  de  la  region  de  rechazo  es  solo  a/2. 

•  El  area  a  la  derecha  de  la  estadfstica  de  prueba  observada  es  solo  (valor  p)l1. 


Los  procedimientos  formales  para  una  prueba  de  hipotesis  y  un  intervalo  de  confianza 
(1  —  a)  100%  para  dos  varianzas  poblacionales  se  muestran  a  continuation. 


PRUEBA  DE  HIPOTESIS  RESPECTO  A  LA  IGUALDAD 
DE  DOS  VARIANZAS  POBLACIONALES 

1 .  Hipotesis  nula:  H0 :  cr2  =  a\ 

2.  Hipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

Ha :  a\  >  cr2  //a :  cr2  A  a\ 

(o  H„ :  cr2  <  cr2) 


3.  Estadistico  de  prueba: 

Prueba  de  una  cola 


Prueba  de  dos  colas 

2 


F 


Aj 

2 


S2 


donde  s2  es  la  varianza 
muestral  mas  grande 

4.  Region  de  rechazo:  rechazar  H0  cuando 

Prueba  de  una  cola  Prueba  de  dos  colas 


F>  Fa  F  >  Fa/2 

o  cuando  valor  p  <  a 


( continua ) 
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PRUEBA  DE  HIPOTESIS  RESPECTO  A  LA  IGUALDAD 
DE  DOS  VARIANZAS  POBLAC  ION  ALES 

( continua ) 

Los  valores  crfticos  de  Fa  y  Fal2  estan  basados  en  df  =  (n,  —  1)  y  df2  =  ( n2  —  1). 
Estos  valores  tabulados,  para  a  =  .100,  .050,  .025,  .010  y  .005,  se  pueden  hallar 
usando  la  tabla  6  del  apendice  I,  o  el  applet  F  Probabilities. 


l3: 


o 


Suposiciones:  Las  muestras  se  seleccionan  al  azar  y  en  forma  independiente  de  las 
poblaciones  normalmente  distribuidas. 


INTERVALO  DE  CONFIANZA  PARA 


<£< 
er  2 


donde  df\  =  (nt  —  I )  y  df2  =  (n2  —  1).  Fdf i4fi  es  el  valor  critico  tabulado  de  F 
coiTespondiente  a  dft  y  df2  grados  de  libertad  en  el  numerador  y  denominador  de 
F,  respectivamente,  con  area  a/2  a  su  derecha. 

Suposiciones:  Las  muestras  se  seleccionan  al  azar  y  en  forma  independiente  de  las 
poblaciones  normalmente  distribuidas. 


Un  experimentador  esta  preocupado  porque  la  variabilidad  de  respuestas  que  usan  dos 
procedimientos  experimentales  diferentes  puede  no  ser  igual.  Antes  de  realizar  su  inves¬ 
tigation,  realiza  un  estudio  previo  con  muestras  aleatorias  de  10  y  8  respuestas  y  obtiene 
s2  =  7.14  y  .v 2  =  3.21,  respectivamente.  ^ Las  varianzas  muestrales  presentan  suficiente 
evidencia  para  indicar  que  las  varianzas  poblacionales  son  desiguales? 


Solucion  Suponga  que  las  poblaciones  tienen  distribuciones  de  probabilidad  que 
poseen  una  razonable  forma  de  montfculo  y  que  por  tanto  satisface,  para  todos  los  fines 
practicos,  la  suposicion  de  que  las  poblaciones  son  normales.  Se  desea  probar  estas 
hipotesis: 


H0 :  a]  =  ar\  contra  Hd :  cr2  A  er22 


Usando  la  tabla  6  del  apendice  I  para  a/ 2  =  .025,  se  puede  rechazar  H0  cuando  F  >  4.82 
con  a  =  .05.  El  valor  calculado  de  la  estadistica  de  prueba  es 


F  = 


s\ 

si 


7.14 

3.21 


2.22 


Debido  a  que  el  estadistico  de  prueba  no  cae  en  la  region  de  rechazo,  no  se  puede  recha¬ 
zar  H0 :  er2  =  a\.  Por  tanto,  hay  insuficiente  evidencia  para  indicar  una  diferencia  en  las 
varianzas  poblacionales. 
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Consulte  el  ejemplo  10.14  y  encuentre  un  intervalo  de  confianza  de  90%  para 
Solucion  El  intervalo  de  confianza  de  90%  para  a]/a\  es 


1 


S  2/^Vl’rf/2 


<r22 


4M/l 


donde 

s\  =  7.14 
dfi  =  («i  ~  1)  =  9 
F%1  =  3.68 


s\  =  3.21 

df2  =  (n2  -  1)  =  7 

F1S  =  3.29 


Sustituyendo  estos  valores  en  la  formula  para  el  intervalo  de  confianza,  se  obtiene 


7.14\  1 


<j\ 

,  <  —7  < 

3.21 7  3.68  a\ 


7.14 

3.21 


2 

3.29  o  .60  <  — \  <  7.32 
02 


La  estimation  calculada  del  intervalo  de  .60  a  7.32  incluye  1 .0,  el  valor  hipotetico  en  H0. 
Esto  indica  que  es  muy  posible  que  a\  =  <r\  y  por  tanto  concuerda  con  las  conclusiones 
de  prueba.  No  rechace  H0 :  a\  =  cr2. 

El  comando  Stat  — »  Basic  Statistics  — >  2  Variances  del  MINITAB  permite  introducir 
ya  sea  information  sin  procesar  o  estadfsticas  resumidas  para  efectuar  la  prueba  F  para 
la  igualdad  de  varianzas  y  calcula  intervalos  de  confianza  para  las  dos  desviaciones 
estandar  individuales  (que  no  hemos  analizado).  La  salida  impresa  relevante,  que  con- 
tiene  el  estadfstico  F  y  su  valor  p,  esta  sombreada  en  la  figura  10.22. 


FIGURA  10.22 

Salida  impresa  del 
MINITAB  para 
el  ejemplo  10.14 


Prueba  para  varianzas  iguales 

95%  Bonferroni  confidence  intervals  for  standard  deviations 
Sample  N  Lower  StDev  Upper 

1  10  1.74787  2.67208  5.38064 

2  8  1.12088  1.79165  4.10374 

F-Test  (Normal  Distribution) 

Test  statistic  =  2.22,  p-value  =  0.304 


La  variabilidad  en  la  cantidad  de  impurezas,  presente  en  un  lote  de  un  producto  qufmico 
empleado  para  un  proceso  particular,  depende  de  la  duration  en  que  el  proceso  esta  en 
operation.  Un  fabricante  que  utiliza  dos  lfneas  de  production,  1  y  2,  ha  hecho  un  ligero 
ajuste  a  la  linea  2,  esperando  con  ello  reducir  la  variabilidad  asf  como  la  cantidad  pro- 
medio  de  impurezas  en  el  producto  qufmico.  Muestras  de  nx  =  25  y  n2  =  25  mediciones 
de  los  dos  lotes  dan  estas  medias  y  varianzas: 

Xr  =  3.2  .s'2  =  1.04 

x2  =  3.0  s\=  .51 


('Vos  datos  presentan  suficiente  evidencia  para  indicar  que  la  variabilidad  del  proceso  es 
menor  para  la  lfnea  2? 

Solucion  El  experimentador  piensa  que  los  niveles  promedio  de  impurezas  son  los 
mismos  para  las  dos  lfneas  de  production  pero  que  su  ajuste  puede  haber  disminuido  la 
variabilidad  de  los  niveles  para  la  lfnea  2,  como  se  ilustra  en  la  figura  10.23.  Este  ajuste 
serfa  bueno  para  la  companfa  porque  disminuirfa  la  probabilidad  de  producir  envfos  del 
producto  qufmico  con  niveles  de  impureza  inaceptablemente  altos. 
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FIGURA  10.23 

Distribuciones  de 
mediciones  de  impureza 
para  dos  Ifneas  de 
produccion 


Para  determinar  la  diminution  en  variabilidad,  la  prueba  de  hipotesis  es 
H0 :  a]  =  ar\  contra  Ha :  a\  >  a\ 


y  el  valor  observado  para  esta  prueba  estadfstica  es 


F  = 


2 

h 

2 

*2 


1.04 

.51 


2.04 


Usando  el  metodo  del  valor  p,  se  pueden  limitar  el  valor  p  de  una  cola  usando  la  tabla  6 
del  apendice  I  con  elf  =  df2  =  (25  —  1)  =  24.  El  valor  observado  de  F  cae  entre  Ftm  = 
1.98  y  F @25  =  2.27,  de  modo  que  .025  <  valor  p  <  .05.  Los  resultados  son  juzgados 
como  significativos  al  nivel  del  5%  y  H0  es  rechazada.  Se  puede  concluir  que  la  variabi¬ 
lidad  de  la  linea  2  es  menor  que  la  de  la  linea  1 . 


La  prueba  F  de  la  diferencia  en  dos  varianzas  poblacionales  completa  la  baterfa  de 
pruebas  que  usted  ha  aprendido  en  este  capitulo  para  hacer  inferencias  acerca  de  para- 
metros  poblacionales  bajo  estas  condiciones: 

•  Los  tamanos  muestrales  son  pequenos. 

•  La  muestra  o  muestras  son  sacados  de  poblaciones  normales. 

Usted  encontrara  que  las  distribuciones  F  y  %2,  asf  como  la  distribution  t  de  Student,  son 
muy  importantes  en  otras  aplicaciones  en  los  capitulos  que  siguen.  Se  usaran  para  dife- 
rentes  estimadores  disenados  para  contestar  tipos  diferentes  de  preguntas  inferenciales, 
pero  las  tecnicas  basicas  para  hacer  inferencias  siguen  siendo  iguales. 

En  la  siguiente  section,  repasamos  las  suposiciones  requeridas  para  todas  estas  herra- 
mientas  de  inferencia  y  analizamos  las  opciones  que  existen  cuando  las  suposiciones  no 
parecen  ser  razonablemente  correctas. 


@ 


EJERCICIOS 


TECNICAS  BASICAS 

10.58  Muestras  aleatorias  independientes  de  dos 
poblaciones  normales  produjeron  las  varianzas  siguientes: 

Tamano  muestral  Varianza  muestral 


a.  (',Los  datos  dan  suficiente  evidencia  para  indicar  que 
a]  difiere  de  a\.  Pruebe  usando  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la 
prueba  e  interprete  su  valor. 


55  7  10.59  Consulte  el  ejercicio  10.58  y  encuentre  un 

20  31 .4  intervalo  de  confianza  de  95%  para  a\la\. 
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10.60  Muestras  aleatorias  independientes  de  dos 
poblaciones  normales  produjeron  las  varianzas  dadas: 

Tamano  muestral  Varianza  muestral 

13  18.3 

13  7.9 

a.  Los  datos  dan  suficiente  evidencia  para  indicar  que 
a]  >  cr: j?  Pruebe  usando  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la 
prueba  e  interprete  su  valor. 

APLICACIONES 

10.61  Calificaciones  del  SAT  Examenes  del  SAT 
en  quimica  y  ffsica11  para  dos  grupos  de  15  estudiantes, 
habiendo  cada  uno  de  estos  seleccionado  estos  examenes, 
se  dan  a  continuacion: 


Quimica 

Flsica 

x  =  629 

x  =  643 

s=  110 

s=  107 

n=  15 

n  =  15 

Para  usar  la  prueba  t  de  dos  muestras  con  una  estimacion 
agrupada  de  a2,  se  debe  suponer  que  las  dos  varianzas 
poblacionales  son  iguales.  Pruebe  esta  suposicion  usando 
la  prueba  F  de  igualdad  de  varianzas.  ■  Cual  es  el  valor  p 
aproximado  para  la  prueba? 

10.62  Calidad  de  un  producto  La  estabilidad  de 
mediciones  en  un  producto  manufacturado  es  importante 
para  mantener  la  calidad  del  producto.  De  hecho,  a  veces 
es  mejor  tener  una  pequena  variacion  en  el  valor  medido 
de  alguna  caracterfstica  importante  de  un  producto, 
asf  como  tener  la  media  del  proceso  ligeramente  fuera 
del  objetivo,  que  sufrir  una  amplia  variacion  con  valor 
medio  que  perfectamente  se  ajuste  a  los  requisitos.  Esta 
ultima  situation  puede  producir  un  porcentaje  mas  alto 
de  productos  defectuosos  que  la  primera.  Un  fabricante  de 
focos  electricos  sospechaba  que  una  de  sus  lfneas 
de  production  estaba  produciendo  focos  con  una  amplia 
variacion  en  duracion  de  vida  util.  Para  probar  su  teorfa, 
compare  las  duraciones  de  vida  util  de  n  =  50  focos 
muestreados  al  azar  de  la  linea  sospechosa  y  n  =  50 
de  una  lmea  que  parecfa  estar  “en  control”.  Las  medias 
muestrales  y  varianzas  para  las  dos  muestras  fueron  como 
sigue: 

"Lineas  sospechosa"  Linea  "en  control" 

x,  =  1 520  x2  =  1476 

s ]  =  92000  s\  =  37000 

a.  i,Los  datos  dan  suficiente  evidencia  para  indicar 
que  los  focos  producidos  por  la  “linea  sospechosa” 
tienen  una  varianza  mas  grande  en  duracion  que  los 
producidos  por  la  linea  que  se  supone  esta  en  control? 
Pruebe  usando  a  =  .05. 


b.  Encuentre  el  valor  p  aproximado  para  la 
prueba  e  interprete  su  valor. 

1 0.63  Construya  un  intervalo  de  confianza  de  90%  para 
la  razon  de  varianza  en  el  ejercicio  10.62. 

10.64  Atun  i!  En  el  ejercicio  10.25  y  el  conjunto  de 
datos  EX  1025,  se  realizo  una  prueba  para  detectar  una 
diferencia  en  el  promedio  de  precios  de  atun  claro  en 
agua  contra  atun  claro  en  aceite. 

a.  ^Que  suposicion  tuvo  que  hacerse  respecto  a 

las  varianzas  poblacionales  para  que  la  prueba  fuera 
valida? 

b.  (:,Los  datos  presentan  suficiente  evidencia  para  indicar 
que  las  varianzas  violan  la  suposicion  en  el  inciso  a)? 
Pruebe  usando  a  =  .05. 

10.65  Corredores  y  ciclistas  III  Consulteel 
ejercicio  10.26.  Susan  Beckham  y  colegas  realizaron 
un  experimento  que  comprendia  10  corredores  sanos 
y  10  ciclistas  sanos,  para  determinar  si  hay  diferencias 
significativas  en  mediciones  de  presion  dentro  del 
compartimiento  del  musculo  anterior  para  corredores  y 
ciclistas.7  Los  datos,  es  decir,  presion  del  compartimiento, 
en  milfmetros  de  mercurio  (Hg),  son  como  sigue: 


Corredores 

Ciclistas 

Desviacion 

Desviacion 

Afeccion 

Media 

estandar 

Media 

estandar 

En  reposo 

80%  maximo 

14.5 

3.92 

11.1 

3.98 

consumo  de  02 

12.2 

3.49 

11.5 

4.95 

Maximo  consumo  de  02 

19.1 

16.9 

12.2 

4.47 

Para  cada  una  de  las  tres  variables  medidas  en  este 
experimento,  pruebe  para  ver  si  hay  una  diferencia 
significativa  en  las  varianzas  para  corredores  contra 
ciclistas.  Encuentre  los  valores  p  aproximados  para  cada 
una  de  estas  pruebas.  (.Sera  apropiada  una  prueba  t  de  dos 
muestras  con  una  estimacion  agrupada  de  o2  para  estas 
tres  variables?  Explique. 

10.66  Impurezas  Un  fabricante  farmaceutico  compra 
un  material  particular  a  dos  proveedores  diferentes. 

El  nivel  medio  de  impurezas  en  la  materia  prima  es 
aproximadamente  igual  para  ambos  proveedores,  pero 
el  fabricante  esta  preocupado  por  la  variabilidad  de  las 
impurezas  de  un  embarque  a  otro.  Si  el  nivel 
de  impurezas  tiende  a  variar  en  forma  excesiva  de  una 
fuente  de  abastecimiento,  podrfa  afectar  la  calidad  del 
producto  farmaceutico.  Para  comparar  la  variacion 
en  el  porcentaje  de  impurezas  de  cada  uno  de  los  dos 
proveedores,  el  fabricante  selecciona  10  envfos  de  cada 
uno  de  ellos  y  mide  el  porcentaje  de  impurezas  en 
la  materia  prima  para  cada  embarque.  Las  medias 
muestrales  y  varianzas  se  muestran  en  la  tabla. 
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ProveedorA  ProveedorB 

x,  =  1 .89  x2  =  1 .85 

Si  =  .273  s\  =  .094 

n,  =  1 0  n2  =  1 0 

a.  (',L«s  datos  dan  suficiente  evidencia  para  indicar 
una  diferencia  en  la  variabilidad  de  los  niveles  de 


impureza  de  envfos  para  los  dos  proveedores?  Pruebe 
usando  a  =  .01.  Con  base  en  los  resultados  de  su 
prueba,  <-,que  recomendacion  se  harfa  al  fabricante 
de  productos  farmaceuticos? 

b.  Encuentre  un  intervalo  de  confianza  de  99%  para  a \  e 
interprete  sus  resultados. 


I Esta  usted  interesado  en  probar  medias?  Si  el  diseno  comprende: 

a.  Una  muestra  aleatoria,  use  la  estadistica  t  de  una  muestra. 

b.  Dos  muestras  aleatorias  independientes,  /.son  iguales  las  varianzas  poblacionales? 

i.  Si  son  iguales,  use  la  estadistica  1  de  dos  muestras  con  s2  agrupada. 

ii.  Si  son  desiguales,  use  la  t  sin  agrupar  con  (ffestimado. 

c.  Dos  muestras  pareadas  con  pares  aleatorios,  use  una  t  de  una  muestra  para  anali- 
zar  diferencias. 


(iEsta  usted  interesado  en  probar  varianzas?  Si  el  diseno  comprende: 

a.  Una  muestra  aleatoria,  use  la  prueba  para  una  sola  varianza. 

b.  Dos  muestras  aleatorias  independientes,  use  la  prueba  F  para  comparar  dos  va¬ 
rianzas. 


REPASO  DE  SUPOSICIONES  DE  MUESTRA 
PEQUENA 

Todas  los  procedimientos  de  prueba  y  estimation  estudiados  en  este  capitulo,  requieren 
que  los  datos  satisfagan  ciertas  condiciones  para  que  las  probabilidades  de  error  (para  las 
pruebas)  y  los  coeficientes  de  confianza  (para  los  intervalos  de  confianza),  sean  iguales 
a  los  valores  que  se  hayan  especificado.  Por  ejemplo,  si  el  experimentador  puede  cons- 
truir  lo  que  piensa  que  es  un  intervalo  de  confianza  de  95%,  puede  estar  seguro  que,  en 
muestreo  repetido,  95%  (y  no  85%  o  75%  o  menos)  de  todos  estos  intervalos  contendran 
el  parametro  de  interes.  Estas  condiciones  se  resumen  en  estas  suposiciones. 


SUPOSICIONES 

1.  Para  todas  las  pruebas  e  intervalos  de  confianza  descritos  en  este  capitulo,  se 
supone  que  las  muestras  se  seleccionan  al  azar  de  poblaciones  normalmente 
distribuidas. 

2.  Cuando  se  seleccionan  dos  muestras,  se  supone  que  se  seleccionan  en  forma 
independiente  excepto  en  el  caso  del  experimento  de  diferencia  pareada. 

3.  Para  pruebas  o  intervalos  de  confianza  respecto  a  la  diferencia  entre  dos  medias 
poblacionales  y  /jl2  con  base  en  muestras  aleatorias  independientes,  se  supone 
que  cr2!  =  cri 
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En  realidad,  usted  nunca  sabra  todo  acerca  de  la  poblacion  muestreada.  Si  lo  sabfa, 
no  habrfa  necesidad  de  muestreo  o  de  estadisticas.  Tambien  es  muy  improbable  que 
una  poblacion  satisfaga  exactamente  las  suposiciones  dadas  en  la  caja.  Por  fortuna, 
los  procedimientos  presentados  en  este  capitulo  dan  buenas  inferencias  cuando  los  datos 
exhiben  desviaciones  moderadas  desde  las  condiciones  necesarias. 

Un  procedimiento  estadistico  que  no  es  sensible  a  desviaciones  desde  las  condiciones 
en  las  que  esta  basado  se  dice  que  es  robusto.  Las  pruebas  t  de  Student  son  muy  robustas 
para  desviaciones  moderadas  desde  normalidad.  Tambien,  mientras  los  tamanos  mues- 
trales  sean  casi  iguales,  no  hay  mucha  diferencia  entre  las  estadisticas  t  agrupadas  y  no 
agrupadas  para  la  diferencia  en  dos  medias  poblacionales.  Sin  embargo,  si  los  tamanos 
muestrales  no  son  claramente  iguales  y  si  las  varianzas  poblacionales  son  desiguales,  la 
estadistica  t  agrupada  da  conclusiones  imprecisas. 

Si  usted  esta  preocupado  de  que  sus  datos  no  satisfagan  las  suposiciones,  hay  otras 
opciones: 

•  Si  puede  seleccionar  muestras  relativamente  grandes,  puede  usar  uno  de  los 
procedimientos  de  muestra  grande  de  los  capitulos  8  y  9,  que  no  se  apoyan  en 
la  normalidad  o  en  suposiciones  de  varianza  iguales. 

•  Puede  usar  una  prueba  no  parametrica  para  contestar  sus  preguntas  inferenciales. 
Estas  pruebas  han  sido  desarrolladas  especificamente  para  que  pocas  o  ninguna 
suposicion  distribucional  se  requieran  para  su  uso.  Las  pruebas  que  se  puedan 
usar  para  comparar  las  ubicaciones  o  variabilidad  de  dos  poblaciones  se  presen- 
tan  en  el  capitulo  15. 


REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Disenos  experimentales  para 
muestras  pequenas 

1 .  Una  muestra  aleatoria:  La  poblacion 
muestreada  debe  ser  normal 

2.  Dos  muestras  aleatorias  independientes: 

Ambas  poblaciones  muestreadas  deben  ser 
normales 

a.  Las  poblaciones  tienen  una  varianza  comun  a2 

b.  Las  poblaciones  tienen  varianzas  diferentes: 

2  2 

CTj  y  or2 

3.  Diseno  de  una  diferencia  pareada  o  pares 
acoplados:  Las  muestras  no  son  independientes 

II.  Pruebas  estadisticas  de  significancia 

1 .  Con  base  en  las  distribuciones  t,  F  y  x2 

2.  Use  el  mismo  procedimiento  que  en  el  capitulo  9 

3.  Region  de  rechazo  — valores  criticos  y  niveles 
de  significancia:  con  base  en  las  distribuciones  t, 
Fox2  con  grados  de  libertad  apropiados 

4.  Pruebas  de  parametros  poblacionales:  una  sola 
media,  la  diferencia  entre  dos  medias,  una  sola 
varianza  y  la  razon  entre  dos  varianzas 


III.  Estadistica  de  prueba  de  muestra 
pequena 

Para  probar  uno  de  los  parametros  poblacionales 
cuando  los  tamanos  muestrales  sean  pequenos,  use  la 
siguiente  estadistica  de  prueba: 

Grados 

Parametro  Estadistico  de  prueba  de  libertad 


M 


Mi  -  M2 

(varianzas  iguales) 


t  _  x  -  Mo 
s/Vn 

(if,  —  *2)  —  (m,  —  M2) 


n  —  1 


n,  +  n2  -  2 


Mi  “  M2 

(varianzas 

desiguales) 


(x,  x2)  (mi  M2) 


Aproximacion 

Satterthwaite 


Mi  -  M2 

(muestras  pareadas) 


t_d  -  Mv 
sjVn 


in  -  1)s2 

2 


n  —  1 


n  -  1 


oi/oi 


F=  sys\ 


n,  - 1 

y  n2-  1 
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Prueba  y  estimacion  de  muestra  pequena 


Las  pruebas  e  intervalos  de  confianza  para  medias  poblacionales  basadas  en  la  distri- 
bucion  t  de  Student  se  encuentran  en  un  submenu  de  MINITAB  si  se  selecciona  Stat  —> 
Basic  Statistics.  El  usuario  vera  opciones  para  1-Sample  t,  2-Sample  t  y  Paired  t,  que 
generaran  cuadros  de  dialogo  para  los  procedimientos  en  la  secciones  10.3,  10.4  y  10.5, 
respectivamente.  El  usuario  debe  escoger  las  columnas  en  las  que  los  datos  se  guarden  y 
las  hipotesis  nula  y  alternativa  a  probarse  (o  el  coeficiente  de  confianza  para  un  intervalo 
de  confianza).  En  el  caso  de  la  prueba  t  de  dos  muestras,  se  debe  indicar  si  las  varianzas 
poblacionales  se  suponen  iguales  o  desiguales,  de  modo  que  el  MINITAB  pueda  efectuar 
la  prueba  correcta.  Exhibiremos  algunos  de  los  cuadros  de  dialogo  y  salidas  de  ventana 
Session  para  los  ejemplos  de  este  capitulo,  empezando  con  la  prueba  t  de  una  muestra 
del  ejemplo  10.3. 

Primero,  se  introducen  los  seis  pesos  registrados,  es  decir,  .46,  61,  .52,  .48,  .57,  .54 
en  la  columna  Cl  y  se  les  nombra  “Pesos”.  Use  Stat  — »  Basic  Statistics  — »  1-Sample  t 
para  generar  el  cuadro  de  dialogo  de  la  figura  10.24.  Para  probar  H0:  /jl  =  .5  contra  77, : 
yu,  >  .5,  use  la  lista  de  la  izquierda  para  seleccionar  “Pesos”  para  la  caja  marcada  “Sam¬ 
ples  in  Columns”.  Verifique  la  caja  marcada  “Perform  hypothesis  test”.  A  continuacion, 
ponga  su  cursor  en  la  caja  marcada  “Hypothesized  mean:”  e  introduzca  .5  como  el  valor 
de  prueba.  Finalmente,  use  Options  y  el  menu  descendente  marcado  “Alternative”  para 
seleccionar  “greater  than”.  De  un  clic  en  OK  dos  veces  para  obtener  la  salida  de  la  figu- 
ra  10.25.  Observe  que  MINITAB  produce  un  intervalo  de  confianza  de  uno  o  de  dos  lados 
para  la  media  poblacional  linica,  consistente  con  la  hipotesis  alternativa  que  ha  escogi- 
do.  Puede  cambiar  el  coeficiente  de  confianza  desde  el  predeterminado  de  .95  en  la  caja 
Options.  Tambien,  la  opcion  Graphs  producira  un  histograma,  una  grafica  de  caja  o  una 
grafica  de  valor  individual  de  los  datos  en  la  columna  C 1 . 

Los  datos  para  una  prueba  t  de  dos  muestras  con  muestras  independientes  se  pueden 
introducir  en  la  hoja  de  trabajo  en  una  de  dos  formas: 


FIGURA  10.24  - 

<l  n  court*; 


C  Vnrun.«l 

r 
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Crflpfov.  j  Qphcra.-.  j 


www.FreeLibros.me 


Ml  MINITAB  O  435 


•  Introduzca  mediciones  desde  ambas  muestras  en  una  sola  columna  e  introduzca 
numeros  (1  o  2)  en  una  segunda  columna  para  identificar  la  muestra  de  la  cual 
proviene  la  medicion. 

•  Introduzca  las  muestras  en  dos  columnas  separadas. 


Si  el  usuario  no  tiene  los  datos  sin  elaborar,  pero  si  tiene  estadlsticas  en  resumen  como 
la  media  muestral,  desviacion  estandar  y  tamano  muestral,  MINITAB  15  le  permitira  usar 
estos  valores  al  seleccionar  el  boton  de  radio  marcado  “Summarized  data”  e  introducir 
los  valores  apropiados  en  las  cajas. 

Use  el  segundo  metodo  e  introduzca  los  datos  del  ejemplo  10.5  en  las  columnas  C2  y 
C3.  A  continuation  use  Stat  — >  Basic  Statistics  — »  2-Sample  t  para  generar  el  cuadro  de 
dialogo  en  la  figura  10.26.  Verifique  “Samples  in  different  columns”,  seleccionando  C2 
y  C3  de  la  caja  de  la  izquierda.  Verifique  la  caja  “Assume  equal  variances”  y  seleccione 
la  hipotesis  alternativa  apropiada  de  la  caj  a  Opciones.  (De  otro  modo,  MINITAB efectuara  la 
aproximacion  de  Satterthwaite  para  varianzas  desiguales.)  La  salida  de  dos  muestras 
cuando  el  usuario  de  un  clic  en  OK  dos  veces  automatic amente  contiene  un  intervalo  de 
confianza  de  95%  de  una  o  de  dos  colas,  as!  como  el  estadlstico  de  prueba  y  valor  p  (se 
puede  cambiar  el  coeficiente  de  confianza  si  se  desea).  La  salida  para  el  ejemplo  10.5 
se  muestra  en  la  figura  10.13. 

Para  una  prueba  de  diferencia  pareada,  las  dos  muestras  se  introducen  en  columnas 
separadas,  lo  cual  hicimos  con  los  datos  de  desgaste  en  llantas  en  la  tabla  10.3.  Use  Stat 
— »  Basic  Statistics  — »■  Paired  t  para  generar  el  cuadro  de  dialogo  de  la  figura  10.27. 

FIGURA  10.26  ^ 
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Si  el  usuario  tiene  solo  resumenes  de  estadfsticos,  es  decir  la  media  muestral  y  des- 
viacion  estandar  de  las  diferencias  y  tamano  muestral,  MINITAB  le  permitira  usar  estos 
valores  al  seleccionar  el  boton  de  radio  marcado  “Summarized  data”  e  introducir 
los  valores  apropiados  en  las  cajas.  Seleccione  C4  y  C5  del  cuadro  de  la  izquierda  y  use 
Options  para  escoger  la  hipotesis  alternativa  apropiada.  Puede  cambiar  el  coeficiente  de 
confianza  o  el  valor  de  prueba  (el  valor  predeterminado  es  cero).  Cuando  de  un  clic  en 
OK  dos  veces,  obtendra  la  salida  que  se  ve  en  la  figura  10.15. 

El  comando  Stat  — »  Basic  Statistics  — >  2  Variances  permite  introducir  ya  sea  datos 
sin  elaborar  o  estadfsticas  en  resumen  para  efectuar  la  prueba  F  para  la  igualdad  de 
varianzas,  como  se  ve  en  la  figura  10.28.  El  comando  Stat  — »  Basic  Statistics  — »  1 
Variance  permitira  efectuar  la  prueba  ~x  y  construir  un  intervalo  de  confianza  para  una 
sola  varianza  poblacional,  cr2. 


FIGURA  10.27 
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EJercicios  suplementarios 

10.67  ^Que  suposiciones  se  hacen  cuando  se  usa  la 
prueba  t  de  Student  para  probar  una  hipotesis  respecto  a 
una  media  poblacional? 

10.68  ^Que  suposiciones  se  hacen  alrededor  de  las 
poblaciones  de  las  que  se  obtienen  muestras  aleatorias, 
cuando  se  usa  la  distribution  t  para  hacer  inferencias 
de  muestra  pequena  respecto  a  la  diferencia  en  medias 
poblacionales? 

10.69  (',Por  que  usar  observaciones  pareadas  para 
estimar  la  diferencia  entre  dos  medias  poblacionales, 
en  lugar  de  la  estimacion  basada  en  muestras  aleatorias 
independientes  seleccionadas  de  las  dos  poblaciones? 

,'Un  experimento  pareado  es  siempre  preferible? 
Explique. 

10.70  Impurezas  I!  Un  fabricante  puede  tolerar 
una  pequena  cantidad  (.05  miligramos  por  litro  (mg/1)) 
de  impurezas  en  una  materia  prima  necesaria  para 
manufacturar  su  producto.  Debido  a  que  la  prueba 

de  laboratorio  para  las  impurezas  esta  sujeta  a  error 
experimental,  el  fabricante  prueba  10  veces  cada  lote. 
Suponga  que  el  valor  medio  del  error  experimental  es  0 
y,  por  tanto,  que  el  valor  medio  de  las  10  lecturas  de 
prueba  es  una  estimacion  insesgada  de  la  verdadera 
cantidad  de  las  impurezas  en  el  lote.  Para  un  lote 
particular  de  materia  prima,  la  media  de  las  10  lecturas 
de  prueba  es  .058  mg/1,  con  una  desviacion  estandar  de 
.012  mg/1.  (jLos  datos  dan  suficiente  evidencia  para 
indicar  que  la  cantidad  de  impurezas  en  el  lote  excede  de 
.05  mg/1?  Encuentre  el  valor  p  para  la  prueba  e  interprete 
su  valor. 

10.71  !ino  rojo  El  crecimiento  del  tallo  principal, 
medido  para  una  muestra  de  17  arboles  de  pino  rojo  de 
cuatro  anos  de  edad,  produjo  una  media  y  desviacion 
estandar  igual  a  11.3  y  3.4  pulgadas,  respectivamente. 
Encuentre  un  intervalo  de  confianza  de  90%  para  el 
crecimiento  medio  de  una  poblacion  de  arboles  de 
pino  rojo  de  cuatro  anos  de  edad  sujetos  a  condiciones 
ambientales  similares. 

10.72  iidroxido  de  sodio  El  objeto  de  un 
experimento  de  quimica  general  es  determinar  la 
cantidad  (en  mililitros)  de  solucion  de  hidroxido  de 
sodio  (NaOH)  para  neutralizar  1  gramo  de  un  acido 
especificado.  Esta  sera  una  cantidad  exacta,  pero  cuando 
el  experimento  se  realice  en  el  laboratorio,  ocurrira 
variation  como  resultado  de  error  experimental.  Se 
hacen  tres  titulaciones  usando  fenolftaleina  como 
indicador  de  la  neutralidad  de  la  solucion  (pH  es  7  para 
una  solucion  neutra).  Los  tres  volumenes  de  NaOH 
requeridos  para  obtener  un  pH  de  7  en  cada  una  de  las 


tres  titulaciones  son  como  sigue:  82.10,  75.75  y  75.44 
mililitros.  Use  un  intervalo  de  confianza  de  99%  para 
estimar  el  numero  medio  de  mililitros  necesarios 
para  neutralizar  1  gramo  del  acido. 

10.73  Cloruro  de  sodio  Mediciones  de  ingesta  de 
agua,  obtenidas  de  una  muestra  de  17  ratas  que  habian 
sido  inyectadas  con  una  solucion  de  cloruro  de  sodio, 
produjeron  una  media  y  desviacion  estandar  de  31.0 

y  6.2  centimetros  cubicos  (cm3),  respectivamente. 

Dado  que  el  promedio  de  ingesta  de  agua  para  ratas 
no  inyectadas  observado  en  un  periodo  comparable  es 
22.0  cm3,  ^los  datos  indican  que  las  ratas  inyectadas 
bebieron  mas  agua  que  las  no  inyectadas?  Pruebe  al 
nivel  de  significancia  de  5%.  Encuentre  un  intervalo  de 
confianza  de  90%  para  la  ingesta  media  de  agua  para 
ratas  inyectadas. 

10.74  Erizos  de  mar  Un  experimentador  estaba 
interesado  en  determinar  el  grosor  medio  de  la  corteza 
de  huevecillos  del  erizo  de  mar.  El  grosor  se  midio 

para  n  =  10  huevos  de  erizo  de  mar  y  se  obtuvieron  estas 
mediciones. 

4.5  6.1  3.2  3.9  4.7 

5.2  2.6  3.7  4.6  4.1 

Estime  el  grosor  medio  de  la  corteza  usando  un  intervalo 
de  confianza  de  95%. 

10.75  Sistemas  de  fabricacion  Unaplanta 
de  produccion  tiene  dos  sistemas  de  fabricacion 
extremadamente  complejos;  uno  de  ellos  tiene  el  doble 
de  antigiiedad  que  el  otro.  Ambos  son  inspeccionados, 
lubricados  y  conservados  una  vez  cada  dos  semanas. 

El  numero  de  productos  terminados  fabricados  al  dia 
por  cada  uno  de  los  sistemas  se  registra  para  30  dfas  de 
trabajo.  Los  resultados  se  dan  en  la  tabla.  ^Estos  datos 
presentan  suficiente  evidencia  para  concluir  que  la 
variabilidad  en  produccion  diaria  justifica  mas  trabajo 
de  mantenimiento  del  sistema  de  fabricacion  antiguo? 

Use  el  metodo  del  valor  p. 

Sistema  nuevo  Sistema  antiguo 

x,  =  246  \  =  240 

Si  =  1 5.6  s2  =  28.2 

((^  datos  10.76  Fosiles  Los  datos  de  la  tabla 
siguiente  son  los  diametros  y  alturas  de 
10  especimenes  fosiles  de  una  especie  de  molusco 
pequeno,  Rotularia  (Annelida)  fallax,  que  fueron 
desenterrados  en  una  expedition  de  trazado  de  mapas 
cerca  de  la  Peninsula  Antartica.12  La  tabla  da  un  simbolo 
de  identification  para  el  especimen  de  fosil,  el  diametro 
y  altura  del  fosil  en  milimetros,  asi  como  la  razon  entre 
diametro  y  altura. 
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Especimen 

Diametro 

Altura 

DIH 

OSU  36651 

185 

78 

2.37 

OSU  36652 

194 

65 

2.98 

OSU  36653 

173 

77 

2.25 

OSU  36654 

200 

76 

2.63 

OSU  36655 

179 

72 

2.49 

OSU  36656 

213 

76 

2.80 

OSU  36657 

134 

75 

1.79 

OSU  36658 

191 

77 

2.48 

OSU  36659 

177 

69 

2.57 

OSU  36660 

199 

65 

3.06 

x : 

184.5 

73 

2.54 

s: 

21.5 

5 

.37 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  el 
diametro  medio  de  la  especie. 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
altura  media  de  la  especie. 

c.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
razon  media  entre  diametro  y  altura. 

d.  Compare  los  tres  intervalos  construidos  en  los  incisos 
a),  b)  y  c).  (';EI  promedio  de  las  razones  es  igual  a  la 
razon  entre  el  promedio  del  diametro  y  el  promedio  de 
altura? 

10.77  Fosiles,  continua  Consulte  el  ejercicio  10.76 
y  el  conjunto  de  datos  EX1076.  Suponga  que  se  desea 
estimar  el  diametro  medio  de  los  especimenes  fosiles, 
correcto  a  no  mas  de  5  milfmetros,  con  probabilidad 
igual  a  .95.  ^Cuantos  fosiles  se  tienen  que  incluir  en  su 
muestra? 

(^) datos  10.78  Alcohol  y  tiempos  de  reaccion 

Para  probar  el  efecto  del  alcohol  al  aumentar  el 
tiempo  de  reaccion  para  responder  a  un  estfmulo  dado, 
se  midieron  los  tiempos  de  reaccion  de  siete  personas. 
Despues  de  consumir  3  onzas  de  alcohol  al  40%,  el 
tiempo  de  reaccion  para  cada  una  de  las  siete  personas 
se  midio  otra  vez.  (jLos  datos  siguientes  indican  que  el 
tiempo  medio  de  reaccion  despues  de  consumir  alcohol 
fue  mayor  que  el  tiempo  medio  de  reaccion  antes  de 
consumir  alcohol?  Use  a  =  .05. 

Persona  1  2  3  4  5  6  7 

Antes  4  5  5  4  3  6  2 

Despues  7835455 

(^)datos  10.79  Queso,  por  favor  A  continuacion 
aparecen  los  precios  por  onza  de  n  =  13 
marcas  diferentes  de  rebanadas  de  queso  envueltas 


individualmente: 

29.0 

24.1 

23.7 

19.6 

27.5 

28.7 

28.0 

23.8 

18.9 

23.9 

21.6 

25.9 

27.4 

Construya  una  estimacion  de  intervalo  de  confianza  de 
95%  del  precio  promedio  base  por  onza  de  rebanadas 
de  queso  envueltas  individualmente. 


10.80  Absorcion  de  medicamento  Se  realizo  un 
experimento  para  comparar  los  tiempos  medios  requeridos 
para  la  absorcion  corporal  de  dos  medicamentos,  A  y  B. 

Se  seleccionaron  al  azar  10  personas  y  se  asignaron 

para  recibir  uno  de  los  medicamentos.  Se  registraron  los 
tiempos  (en  minutos)  para  que  el  medicamento  llegara  a 
un  nivel  especificado  en  el  torrente  sangufneo 
y  el  resumen  de  datos  se  da  en  la  tabla: 

Medicamento  A  Medicamento  B 

x j  =  27 .2  x2  =  33.5 

s,  =  16.36  si  =18.92 

a.  t,Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  tiempos  medios  para  la  absorcion  de  los 
dos  medicamentos?  Pruebe  usando  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba. 

(■,Este  valor  confirma  sus  conclusiones? 

c.  Encuentre  un  intervalo  de  confianza  de  95%  para 
la  diferencia  en  tiempos  medios  de  absorcion. 

(:,EI  intervalo  confirma  sus  conclusiones? 

10.81  Absorcion  de  medicamento,  continua 

Consulte  el  ejercicio  10.80.  Supongamos  que  desea 
estimar  la  diferencia  en  tiempos  medios  para  la  correcta 
absorcion,  a  no  mas  de  1  minuto  de  diferencia,  con 
probabilidad  aproximadamente  igual  a  .95. 

a.  ^Aproximadamente  que  tan  grande  se  requiere  una 
muestra  para  cada  medicamento  (suponga  que  los 
tamanos  muestrales  son  iguales)? 

b.  Si  realizar  el  experimento  usando  los  tamanos 
muestrales  del  inciso  a)  requeriran  mucho  tiempo  y 
dinero,  ^puede  hacerse  algo  para  reducir  los  tamanos 
muestrales  y  todavfa  obtener  un  margen  de  error  de 

1  minuto  para  la  estimacion? 

(^)datos  10.82  Faisanes  de  cuello  anillado  A 

continuacion  se  dan  los  pesos  en  gramos  de  10 
machos  y  10  hembras  jovenes  de  faisanes  de  cuello  anillado. 


Machos 

Hembras 

1384 

1672 

1073 

1058 

1286 

1370 

1053 

1123 

1503 

1659 

1038 

1089 

1627 

1725 

1018 

1034 

1450 

1394 

1146 

1281 

a.  Use  una  prueba  estadfstica  para  determinar  si  la 
varianza  poblacional  de  los  pesos  de  los  machos 
difiere  de  la  de  las  hembras. 

b.  Pruebe  si  el  peso  promedio  de  machos  jovenes  de 
faisanes  de  cuello  anillado  excede  del  de  las  hembras 
en  mas  de  300  gramos.  (sugerencia:  El  procedimiento 
que  use  debe  tomar  en  cuenta  los  resultados  del 
analisis  del  inciso  a).) 
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(^Jdatos  10.83  Abejas  Los  insectos  que  revolotean 
en  vuelo  gastan  enormes  cantidades  de 
energfa  para  su  tamano  y  peso.  Los  datos  mostrados 
aquf  fueron  tornados  de  un  conjunto  mucho  mayor 
de  datos  recolectados  por  T.M.  Casey  y  colegas.13 
Muestran  las  frecuencias  de  aleteo  (en  hertz)  para 
dos  especies  diferentes  de  abejas,  =  4  Euglossa 
mandibularis  Friese  y  n2  =  6  Euglossa  imperialis 
Cockerell. 

E.  mandibularis  Friese  £  imperialis  Cockerell 


235 

180 

225 

169 

190 

180 

188 

185 

178 

182 

a.  Con  base  en  los  rangos  observados,  ^piensa 
usted  que  hay  diferencia  entre  las  dos  varianzas 
poblacionales? 

b.  Use  una  prueba  apropiada  para  determinar  si  hay 
diferencia. 

c.  Explique  por  que  una  prueba  t  de  Student  con  un 
estimador  s2  agrupado  es  inapropiado  para  comparar 
las  frecuencias  medias  de  aleteo  para  las  dos  especies 
de  abejas. 

datos  10.84  Calcio  El  contenido  de  calcio  (Ca) 

de  una  sustancia  mineral  en  polvo  fue  analizada 
10  veces,  registrandose  las  siguientes  composiciones 
porcentuales: 

.0271  .0282  .0279  .0281  .0268 

.0271  .0281  .0269  .0275  .0276 

a.  Encuentre  un  intervalo  de  confianza  de  99% 
para  el  verdadero  contenido  de  calcio  de  esta 
sustancia. 

b.  £Que  significa  la  frase  “99%  de  confianza”? 

c.  2,Que  suposiciones  se  deben  hacer  del  procedimiento 
de  muestreo  para  que  este  intervalo  de  confianza  sea 
valido?  £Que  significa  esto  para  el  qufmico  que  realiza 
el  analisis? 

10.85  <jSol  o  sombra?  Karl  Niklas  y  T.G.  Owens 
examinaron  las  diferencias  en  una  planta  particular, 
Plantago  Major  L.,  cuando  crecen  a  plena  luz  del 
sol  contra  condiciones  de  sombra.14  En  este  estudio, 
las  plantas  en  sombra  recibieron  luz  solar  directa 
durante  menos  de  2  horas  al  dfa,  en  tanto  que  las 
plantas  a  pleno  sol  nunca  tuvieron  sombra.  Un  resumen 
parcial  de  los  datos  basados  en  =  16  plantas  a 
pleno  sol  y  n2  =  15  plantas  de  sombra  se  muestra 
a  continuacion: 


Pleno  sol 

Sombra 

X  s 

X  s 

Area  de  hojas  (cm2) 
Area  traslape  (cm2) 

128.00 

43.00 

78.70 

41.70 

46.80 

2.21 

8.10 

1.26 

Numero  de  hojas 

9.75 

2.27 

6.93 

1.49 

Grosor(mm) 

.90 

.03 

.50 

.02 

Longitud  (cm) 

8.70 

1.64 

8.91 

1.23 

Ancho  (cm) 

5.24 

.98 

3.41 

.61 

a.  cQue  suposiciones  se  requieren  para  usar  los 
procedimientos  de  muestra  pequena  dados  en  este 
capitulo,  para  comparar  plantas  a  pleno  sol  contra  las 
de  sombra? 

b.  7,Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  area  media  de  hojas  para  plantas  de 
pleno  sol  contra  las  de  sombra? 

c.  £Los  datos  presentan  suficiente  evidencia  para 
indicar  una  diferencia  en  area  media  de  traslape  para 
plantas  de  pleno  sol  contra  las  de  sombra? 

10.86  Jugo  de  naranja  Se  ha  de  hacer  una 
comparacion  de  las  precisiones  de  dos  maquinas 
desarrolladas  para  extraer  jugo  de  naranjas,  usando  los 
datos  siguientes: 

Maquina  A  Maquina  B 

s 2  =  3.1  onzas2  s2  =  1.4  onzas2 

n  =  25  n  =  25 

a.  £Hay  suficiente  evidencia  para  indicar  que  hay  una 
diferencia  en  la  precision  de  las  dos  maquinas  al  nivel 
de  significancia  de  5%? 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para 

la  razon  entre  las  dos  varianzas  poblacionales.  ^Este 
intervalo  confirma  las  conclusiones  de  usted  respecto 
del  inciso  a)?  Explique. 

10.87  iEn  casa  o  en  la  escuela?  Cuatro  pares  de 
gemelos  identicos  (pares  A,  B,  C  y  D)  se  seleccionaron  al 
azar  de  una  base  de  datos  de  gemelos  identicos.  Un  nino 
se  selecciono  al  azar  de  cada  par  para  formar  un  “grupo 
experimental”.  Estos  cuatro  ninos  fueron  enviados  a 

la  escuela.  Los  otros  cuatro  ninos  se  mantuvieron  en 
casa  como  grupo  de  control.  Al  final  del  ano  escolar,  se 
obtuvieron  las  siguientes  calificaciones  de  Cl  (cociente 
de  inteligencia): 


Par 

Grupo  experimental 

Grupo  de  control 

A 

110 

111 

B 

125 

120 

C 

139 

128 

D 

142 

135 

(',Esta  evidencia  justifica  la  conclusion  de  que  la  falta 
de  experiencia  escolar  tiene  un  efecto  desalentador  en 
calificaciones  del  Cl?  Use  el  metodo  del  valor  p. 
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datos  10.88  Dietas  Ocho  personas  obesas  fueron 
puestas  a  dieta  durante  un  mes,  registrandose  sus 
pesos  al  principio  y  a  final  del  mes: 


Pesos 


Persona 

Inicial 

Final 

1 

310 

263 

2 

295 

251 

3 

287 

249 

4 

305 

259 

5 

270 

233 

6 

323 

267 

7 

277 

242 

8 

299 

265 

Estime  la  perdida  media  de  peso  para  personas  obesas 
cuando  se  ponen  a  dieta  durante  un  periodo  de  un  mes. 
Use  un  intervalo  de  confianza  de  95%  e  interprete  sus 
resultados.  ^Que  suposiciones  deben  hacerse  para  que  la 
inferencia  sea  valida? 

(^)datos  10.89  Jostos  de  reparacion  Los 

fabricantes  de  autos  tratan  de  disenar 
los  parachoques  de  sus  autos  para  evitar  perdidas 
economicas  en  accidentes  como  los  que  ocurren  en  un 
estacionamiento.  Para  comparar  costos  de  reparacion  de 
parachoques  delanteros  contra  los  traseros  para  varias 
marcas  de  autos,  estos  fueron  sometidos  a  impactos  de 
frente  y  por  atras  a  5  mph  y  se  registraron  los  costos 
de  reparacion.15 


Vehiculo 

Frente 

Atras 

VW  Jetta 

$396 

$602 

Daewoo  Nubira 

451 

404 

Acura  3.4  RL 

1123 

968 

Dodge  Neon 

687 

748 

Nissan  Sentra 

583 

571 

(.Los  datos  dan  suficiente  evidencia  para  indicar  que  hay 
una  diferencia  significativa  en  el  promedio  de  costos  de 
reparacion  para  reparaciones  de  parachoques  delanteros  y 
traseros?  Pruebe  usando  a  =  .05. 

(^)datos  10.90  Formas  de  respiracion  Psicologos 
investigadores  midieron  las  formas  de 
respiracion  como  punto  de  inicio,  es  decir,  la  ventilacion 
total  (en  litros  de  aire  por  minuto)  ajustados  para  el 
tamano  del  cuerpo,  para  cada  uno  de  n  =  30  pacientes, 
de  modo  que  pudieran  estimar  el  promedio  de  ventilacion 
total  para  pacientes  antes  de  realizar  cualquier 
experimento.  Los  datos,  junto  con  alguna  salida  impresa 
MINITAB,  se  presentan  a  continuation: 


5.23 

5.72 

5.77 

4.99 

5.12 

4.82 

5.54 

4.79 

5.16 

5.84 

4.51 

5.14 

5.92 

6.04 

5.83 

5.32 

6.19 

5.70 

4.72 

5.38 

5.48 

5.37 

4.96 

5.58 

4.67 

5.17 

6.34 

6.58 

4.35 

5.63 

Salida  impresa  MINITAB  para  el  ejercicio  10.90 

Pantalla  de  tallo  y  hoja:  Its/min 

Stem-and- leaf  of  Ltrs/min  N  =  30 
Leaf  Unit  =  0.10 


1 

4 

3 

2 

4 

5 

5 

4 

677 

8 

4 

899 

12 

5 

1111 

(4) 

5 

2333 

14 

5 

455 

11 

5 

6777 

7 

5 

889 

4 

6 

01 

2 

6 

3 

1 

6 

5 

Estadistica  descriptiva:  Its/min 


Variable 

N  N* 

Mean 

SE  Mean 

StDev 

Ltrs/min 

30  0 

5.3953 

0.0997 

0.5462 

Minimum 

Q1 

Median 

Q3 

Maximum 

4 . 3500 

4 . 9825 

5 .3750 

5 . 7850 

6.5800 

a.  /.Que  information  da  la  grafica  de  tallo  y  hoja  acerca 
de  los  datos?  i Por  que  es  importante  esto? 

b.  Use  la  salida  impresa  MINITAB  para  construir 

un  intervalo  de  confianza  de  99%  para  el  promedio  de 
ventilacion  total  para  pacientes. 

10.91  Tiempos  de  reaccion  Una  comparacion  de 
tiempos  de  reaccion  (en  segundos)  para  dos  estimulos 
diferentes,  en  un  experimento  de  asociacion  psicologica 
de  palabras,  produjo  los  siguientes  resultados  cuando  se 
aplican  a  una  muestra  aleatoria  de  16  personas: 


Estimulo  1 

13  2  1 

2  13  2 

Estimulo  2 

4  2  3  3 

12  3  3 

(',Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  tiempos  medios  de  reaccion  para  los 
dos  estimulos?  Pruebe  usando  a  =  .05. 

10.92  Tiempos  de  reaccion  II  Consul te  el  ejercicio 
10.91.  Suponga  que  el  experimento  de  asociacion  de 
palabras  se  realiza  usando  ocho  personas  como  bloques 
y  haciendo  una  comparacion  de  tiempos  de  reaccion 
dentro  de  cada  persona;  esto  es,  cada  persona  es  sometida 
a  ambos  estimulos  en  orden  aleatorio.  Los  tiempos  de 
reaccion  (en  segundos)  para  el  experimento  son  como 
sigue: 

Persona  Estimulo  1  Estimulo  2 

1  3  4 

2  1  2 

3  1  3 

4  2  1 

5  1  2 

6  2  3 

7  3  3 

8  2  3 
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Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  tiempos  medios  de  reaccion  para  los 
dos  estfmulos?  Pruebe  usando  a  =  .05. 

10.93  Consulte  los  ejercicios  10.91  y  10.92.  Calcule  un 
intervalo  de  confianza  de  95%  para  la  diferencia  en  las 
dos  medias  poblacionales  para  cada  uno  de  estos  disenos 
experimentales.  ^Parece  que  el  bloqueo  aumento  la 
cantidad  de  informacion  disponible  en  el  experimento? 

(^)datos  10.94  Resistencia  al  impacto  Los  datos 
siguientes  son  lecturas  (en  pies-libras)  de  las 
resistencias  al  impacto  de  dos  clases  de  material  de 
empaque: 

A_B 

1.25  .89 

1.16  1.01 
1.33  .97 

1.15  .95 

1.23  .94 

1.20  1.02 
1.32  .98 

1.28  1.06 
1.21  .98 

Salida  impresa  MINITABpara  el  ejercicio  10.94 

Prueba  T  de  dos  muestras  y  Cl:  A  y  B 
Two- sample  T  for  A  vs  B 

N  Mean  StDev  SE  Mean 

A  9  1.2367  0.0644  0.021 

B  9  0.9778  0.0494  0.016 

Difference  =  mu  (A)  -  mu  (B) 

Estimate  for  difference:  0.2589 

95%  Cl  for  difference:  (0.2015,  0.3163) 

T-Test  of  difference  =  0  (vs  not  =) : 

T-Value  =  9.56  P-Value  =  0.000  DF  =  16 
Both  use  Pooled  StDev  =  0.0574 

a.  Use  la  salida  impresa  MINITAB  para  determinar  si  hay 
evidencia  de  una  diferencia  en  las  resistencias  medias 
para  las  dos  clases  de  material. 

b.  pHay  implicaciones  practicas  a  sus  resultados? 

10.95  lezclas  de  pastel  Se  realizo  un  experimento 
para  comparar  las  densidades  (en  onzas  por  pulgada 
cubica)  de  pasteles  elaborados  con  dos  mezclas  diferentes 
de  pastel.  Seis  charolas  para  pastel  se  llenaron  con  la 
pasta  A  y  seis  se  llenaron  con  la  pasta  B .  Esperando  una 
variation  en  temperatura  del  homo,  el  experimentador 
puso  una  charola  llena  de  pasta  A  y  otra  con  pasta  B  una 
al  lado  de  la  otra  en  seis  lugares  diferentes  del  homo. 

Las  seis  observaciones  pareadas  de  densidades  son  como 
sigue: 


Pasta  A 

.135 

.102 

.098 

.141 

.131 

.144 

Pasta  B 

.129 

.120 

.112 

.152 

.135 

.163 

a.  (',Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  entre  las  densidades  promedio  de 
pasteles  elaborados  usando  los  dos  tipos  de  pasta? 

b.  Construya  un  intervalo  de  confianza  de  95%  para  la 
diferencia  entre  las  densidades  promedio  para  las  dos 
mezclas. 

10.96  ^Bajo  que  suposiciones  puede  usarse  la 
distribution  F  al  hacer  inferences  acerca  de  la  razon 
entre  varianzas  poblacionales? 

10.97  iCompro  leche?  Hay  en  el  mercado  una 
nueva  maquina  llenadora  de  recipientes  para  una 
empresa  de  productos  lacteos,  la  que  esta  considerando 
dos  nuevos  modelos,  manufacturados  por  la  compafha 
A  y  la  compafha  B.  Robustez,  costo  y  comodidad  son 
comparables  en  los  dos  modelos,  de  modo  que  el  factor 
decisivo  es  la  variabilidad  en  el  llenado.  Se  prefiere  el 
modelo  que  produce  llenados  con  menor  varianza.  Si 
se  obtienen  muestras  de  llenados  para  cada  uno  de  los 
dos  modelos,  se  puede  usar  una  prueba  F  para  probar  la 
igualdad  de  varianzas  poblacionales.  i Que  tipo  de  region 
de  rechazo  serfa  mas  favorecida  por  cada  una  de  estas 
personas? 

a.  El  gerente  de  la  empresa  de  lacteos,  ^por  que? 

b.  Un  representante  de  ventas  de  la  compafha  A, 
t,P°r  que? 

c.  Un  representante  de  ventas  de  la  compafua  B,  ^por  que? 

10.98  iCompro  leche?  1  Consulte  el  ejercicio 
10.97.  Deseando  demostrar  que  la  variabilidad  de 
llenados  es  menor  para  su  modelo  que  para  el  de  su 
competidora,  una  representante  de  ventas  de  la  compafha 
A  adquirio  una  muestra  de  30  llenados  del  modelo  de  su 
compafha  y  una  muestra  de  10  llenados  del  modelo 

de  su  competidora.  Las  varianzas  muestrales  fueron 
s\  =  .027  y  j2s  ,  respectivamente.  ^Este  resultado  da 
apoyo  estadfstico  al  nivel  de  significancia  de  .05  para  lo 
dicho  por  la  representante  de  ventas? 

10.99  Pureza  quimica  Un  fabricante  de  productos 
qufmicos  dice  que  la  pureza  de  su  producto  nunca  varfa 
en  mas  de  2%.  Cinco  lotes  se  probaron  y  dieron  lecturas 
de  pureza  de  98.2,  97.1,  98.9,  97.7  y  97.9%. 

a.  f,Los  datos  dan  suficiente  evidencia  para  contradecir 
lo  dicho  por  el  fabricante?  (sugerencia:  Para  ser 
generosos,  sea  un  rango  de  2%  igual  a  4cr.) 

b.  Encuentre  un  intervalo  de  confianza  de  90%  para  a2. 

10.100  i.Latas  de  16  onzas?  Una  empacadora  de 
productos  enlatados  indica  “peso  de  16  onzas”  en  su 
etiqueta.  La  supervisora  de  control  de  calidad  selecciona 
nueve  latas  al  azar  y  las  pesa.  Encuentra  x  =  1 5.7  y  s  = 
.5.  /.Los  datos  presentan  suficiente  evidencia  para  indicar 
que  el  peso  medio  es  menor  que  lo  dicho  en  la  etiqueta? 
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10.101  Tiempos  de  reaccion  III  Un  psicologo  desea 
verificar  que  cierto  medicamento  aumenta  el  tiempo  de 
reaccion  a  un  estfmulo  dado.  Los  siguientes  tiempos 
de  reaccion  (en  decimos  de  segundo)  se  registraron  antes 
y  despues  de  la  inyeccion  del  medicamento  para  cada  una 
de  las  cuatro  personas: 

Tiempo  de  reaccion 
Persona  Antes  Despues 

1  7  13 

2  2  3 

3  12  18 

4  12  13 

Pruebe  al  nivel  de  significancia  de  5%  para  determinar  si 
el  medicamento  aumento  significativamente  el  tiempo  de 
reaccion. 

datos  10.102  Produccion  de  alimentos  En 
EX10102  un  tiempo  en  que  la  conservacion  de  energfa 
es  tan  importante,  algunos  cientfficos  piensan  que  debe 
darse  un  escrutinio  mas  estrecho  al  costo  (en  energfa)  de 
producir  varias  formas  de  alimentos.  Supongamos  que  se 
desea  comparar  la  cantidad  media  de  petroleo  necesario 
para  producir  1  acre  de  mafz  contra  1  acre  de  coliflor. 

Las  lecturas  (en  barriles  de  petroleo  por  acre),  con  base  en 
lotes  de  20  acres,  siete  por  cada  cosecha,  se  muestran 
en  la  tabla  siguiente.  Use  estos  datos  para  hallar  un 
intervalo  de  confianza  de  90%  para  la  diferencia  entre  las 
cantidades  medias  de  petroleo  requeridas  para  producir 
estas  dos  cosechas. 

Maiz  Coliflor 


5.6 

15.9 

7.1 

13.4 

4.5 

17.6 

6.0 

16.8 

7.9 

15.8 

4.8 

16.3 

5.7 

17.1 

10.103  Alcohol  y  altitud  El  efecto  del  consumo 
de  alcohol  en  el  cuerpo  parece  ser  mucho  mayor  a  grandes 
alturas  que  al  nivel  del  mar.  Para  probar  esta  teorfa,  un 
cientffico  selecciona  al  azar  12  personas  y  las  divide  de 
igual  modo  en  dos  grupos  de  seis  cada  uno.  Un  grupo 
se  pone  en  una  camara  que  Simula  condiciones  a  una 
altitud  de  12000  pies  y  cada  persona  ingiere  una  bebida 
que  contiene  100  centfmetros  cubicos  (cc)  de  alcohol.  El 
segundo  grupo  recibe  la  misma  bebida  en  una  camara  que 
Simula  condiciones  al  nivel  del  mar.  Despues  de  2  horas, 
se  mide  la  cantidad  de  alcohol  en  la  sangre  (gramos  por 
100  cc)  de  cada  persona.  Los  datos  se  muestran  en  la 
tabla.  7L0S  datos  dan  suficiente  evidencia  para  apoyar 
la  teorfa  de  que  la  retencion  de  alcohol  en  la  sangre  es 
mayor  a  grandes  alturas? 


Nivel  del  mar  12000  pies 


.07 

.13 

.10 

.17 

.09 

.15 

.12 

.14 

.09 

.10 

.13 

.14 

10.104  iesgos  accionarios  Los  precios  al  cierre 
de  dos  acciones  comunes  se  registraron  durante  un 
periodo  de  15  dfas.  Las  medias  y  varianzas  son 

if,  =  40.33  x2  =  42.54 
Si  =  1 .54  S2  =  2. 96 

a.  (',Estos  datos  presentan  suficiente  evidencia,  para 
indicar  una  diferencia  entre  las  variabilidades  de 
los  precios  al  cierre  de  las  dos  acciones,  para  las 
poblaciones  asociadas  con  las  dos  muestras?  De  el 
valor  de  p  para  la  prueba  e  interprete  este  valor. 

b.  Construya  un  intervalo  de  confianza  de  99%  para  la 
razon  entre  las  dos  varianzas  poblacionales. 

1 0. 1 05  Diseno  de  autos  Se  realiza  un  experimento 
para  comparar  dos  nuevos  disenos  de  automoviles.  Se 
seleccionan  20  personas  al  azar  y  a  cada  una  se  le  pide 
calificar  cada  diseno  en  una  escala  de  1  (mala)  a  10 
(excelente).  Las  calificaciones  resultantes  se  usaran 
para  probar  la  hipotesis  nula  de  que  el  nivel  medio 

de  aprobacion  es  igual  para  ambos  disenos  contra  la 
hipotesis  alternativa  de  que  se  prefiere  uno  de  los 
disenos  de  autos.  Estos  datos  satisfacen  las 
suposiciones  requeridas  para  la  prueba  t  de  Student 
de  la  seccion  10.4?  Explique. 

10.106  Programas  de  seguridad  Los  datos 
mostrados  a  continuation  se  recolectaron  del  tiempo 
perdido  en  accidentes  (las  cifras  dadas  son  horas 
medias  de  trabajo  perdido  por  mes,  en  un  periodo  de 
un  ano)  antes  y  despues  de  poner  en  vigor  un  programa 
de  seguridad  industrial.  Se  registraron  datos  para  seis 
plantas  industriales.  (;Los  datos  dan  suficiente  evidencia 
para  indicar  si  el  programa  de  seguridad  fue  eficaz  para 
reducir  el  tiempo  perdido  en  accidentes?  Pruebe  usando 
a  =  .05. 

Plants  Numero 

1  2  3  4  5  6 

Antes  del  programa  38  64  42  70  58  30 

Despues  del  programa  31  58  43  65  52  29 

(^)datos  10.107  Dos  ingresos  diferentes  Para 
EX10107  comparar  la  demanda  de  dos  ingresos  diferentes, 
el  gerente  de  una  cafeteria  registro  el  numero  de  compras 
de  cada  ingreso  en  siete  dfas  consecutivos.  Los  datos  se 
muestran  en  la  tabla.  <',Los  datos  dan  suficiente  evidencia 
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para  indicar  una  mayor  demanda  media  para  uno  de  los 
ingresos? 


Dfa 

A 

B 

lunes 

420 

391 

martes 

374 

343 

miercoles 

434 

469 

jueves 

395 

412 

viernes 

637 

538 

sabado 

594 

521 

domingo 

679 

625 

Salida  impresa  MINITABpara  el  ejercicio  10.107 

Prueba  T  pareada  y  CE:  A  y  B 

Paired  T  for  A  -  B 


N 

Mean 

StDev 

SE 

Mean 

A 

7 

504 . 7 

127.2 

48 . 1 

B 

7 

471.3 

97.4 

36 . 8 

Difference 

7 

33.4 

47 . 5 

18 . 0 

95%  Cl 

for 

mean 

.  difference: 

(-10. 

5,  77 

.4) 

T-Test 

of  mean 

difference  = 

0  (vs 

not 

=  0)  : 

T-Value  =  1.86  P-Value  =  0.112 

10.108  Control  de  contaminacion  El  lfmite  de  la 
EPA  de  descarga  permisible  de  solidos  suspendidos  en 
rfos  y  arroyos  es  de  60  miligramos  por  litro  (mg/1)  por 
dfa.  Un  estudio  de  muestras  de  agua  seleccionadas  de 

la  descarga  en  una  mina  de  fosfato  muestra  que  en  un 
tiempo  prolongado,  la  descarga  media  diaria  de  solidos 
suspendidos  es  48  mg/1,  pero  las  lecturas  de  descargas 
de  un  dfa  para  otro  son  variables.  Unos  inspectores  del 
estado  midieron  los  porcentajes  de  descarga  de  solidos 
suspendidos  para  n  =  20  dfa  y  hallaron  s2  =  39  (mg/1)2. 
Encuentre  un  intervalo  de  confianza  de  90%  para  cr2. 
Interprets  sus  resultados. 

10.109  Enzimas  Se  emplearon  dos  metodos  para 
medir  la  actividad  especffica  (en  unidades  de  actividad 
enzimatica  por  miligramo  de  protefna)  de  una  enzima. 
Una  unidad  de  actividad  enzimatica  es  la  cantidad  que 
cataliza  la  formation  de  1  micromol  de  producto  por 
minuto  bajo  condiciones  especificadas.  Use  una  prueba 
apropiada  o  procedimiento  de  estimation  para  comparar 
los  dos  metodos  de  medicion.  Comente  sobre  la  validez 
de  cualesquiera  suposiciones  que  haya  necesidad  de 
hacer. 


Metodo  1 

125 

137 

130 

151 

142 

Metodo  2 

137 

143 

151 

156 

149 

10.110  larras  conectoras  Un  productor  de 
piezas  maquinadas  dice  que  los  diametros  de  las  barras 
conectoras  producidas  por  su  planta  tenfan  una  varianza 
de  a  lo  sumo  .03  pulgada2.  Una  muestra  aleatoria  de 
15  barras  conectoras  de  su  planta  produjo  una  media  y 
varianza  muestrales  de  .55  pulgadas  y  .053  pulgadas2, 
respectivamente. 


a.  7,  Hay  suficiente  evidencia  para  rechazar  lo  dicho  por 
el  productor  al  nivel  de  significancia  de  a  =  .05? 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
varianza  de  los  diametros  de  barras  conectoras. 

10.111  Sueno  y  el  estudiante  universitario 

(\Cuanto  duerme  usted  en  una  noche  escolar  tfpica?  A 
un  grupo  de  10  estudiantes  universitarios  se  le  pidio 
informar  el  numero  de  horas  que  dormfan  en  la  noche 
previa,  con  los  siguientes  resultados: 

7,  6,  7.25,  7,  8.5,  5,  8,  7,  6.75,  6 

a.  Encuentre  un  intervalo  de  confianza  de  99%  para  el 
numero  promedio  de  horas  que  duermen  estudiantes 
universitarios. 

b.  i Que  suposiciones  se  requieren  para  que  este  intervalo 
de  confianza  sea  valido? 

datos  10.112  Reacomodo  de  objetos  Los 

ex  10112  siguientes  datos  son  tiempos  de  respuesta,  en 
segundos,  para  n  =  25  estudiantes  de  primer  ano  para 
acomodar  tres  objetos  por  tamano. 


5.2 

3.8 

5.7 

3.9 

3.7 

4.2 

4.1 

4.3 

4.7 

4.3 

3.1 

2.5 

3.0 

4.4 

4.8 

3.6 

3.9 

4.8 

5.3 

4.2 

r>- 

3.3 

4.2 

3.8 

5.4 

Encuentre  un  intervalo  de  confianza  de  95%  para  el 
promedio  de  tiempo  de  respuesta  para  estudiantes 
de  primer  ano  para  acomodar  tres  objetos  por  tamano. 
Interprete  este  intervalo. 

10.113  jChuparse  el  dedo  es  bueno!  Quiza 
demasiado  bueno,  segun  pruebas  efectuadas  por 
la  division  de  pruebas  del  consumidor  de  Good 
Housekeeping.  La  informacion  nutrimental  proporcionada 
por  Kentucky  Fried  Chicken  dice  que  cada  pequena 
bolsa  de  cunas  de  papas  contiene  4.8  onzas  de  alimento, 
para  un  total  de  280  calorfas.  Una  muestra  de  10  ordenes 
de  restaurantes  KFC  en  Nueva  York  y  Nueva  Jersey 
promediaron  358  calorfas.16  Si  la  desviacion  estandar  de 
esta  muestra  fue  s  =  54, 7,hay  suficiente  evidencia  para 
indicar  que  el  numero  promedio  de  calorfas  en  pequenas 
bolsas  de  cunas  de  papas  de  KFC  es  mayor  al  anunciado? 
Pruebe  al  nivel  de  significancia  de  1%. 

10.1 14  Ratas  de  centro  comercial  Un  artfculo  de 
American  Demographics  investigo  habitos  de  consumo 
en  el  centro  comercial.  Tendemos  a  gastar  mas  dinero 
de  compras  en  fines  de  semana  y,  en  particular,  los 
domingos  de  4  a  6  p.m.  Los  miercoles  por  la  manana 
los  compradores  gastan  menos.17  Supongamos  que  se 
selecciono  una  muestra  aleatoria  de  20  compradores  de 
fin  de  semana  y  una  muestra  aleatoria  de  20  compradores 
de  dfa  laborable,  registrandose  la  cantidad  gastada  por 
viaje  al  centro  comercial. 
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Fines  de  semana 

Tamano  muestral 

Dia  habil 

20 

20 

Media  muestral 

$78 

$67 

Desviacion  muestral  estandar 

$22 

$20 

a.  <:,Es  razonable  suponer  que  las  dos  varianzas 
poblacionales  son  iguales?  Use  la  prueba  F  para 
probar  esta  hipotesis  con  a  =  .05. 

b.  Con  base  en  los  resultados  del  inciso  a),  use  la 
prueba  apropiada  para  determinar  si  hay  diferencia 
en  la  cantidad  promedio  gastada  por  viaje  en  fines  de 
semana  contra  dias  laborables.  Pruebe  usando 

a  =  .05. 

(^)datos  10.115  Guerras  de  fronteras  Amedida 
exioi  1 5  que  aumentan  los  costos  de  medicamentos 
recetados,  mas  y  mas  ciudadanos  mayores  estan 
ordenando  recetas  de  Canada,  o  en  verdad  cruzan  la 
frontera  para  comprar  medicamentos  recetados.  El  precio 
de  una  receta  tfpica  para  nueve  medicamentos  mas 


vendidos  se  registro  al  azar,  en  tiendas  seleccionadas  al 
azar,  tanto  en  Estados  Unidos  como  en  Canada.18 


Medicamento 

E.U. 

Canada 

Lipitor® 

$290 

$179 

Zocor® 

412 

211 

Prilosec® 

117 

72 

Norvasc® 

139 

125 

Zyprexa® 

571 

396 

Paxil® 

276 

171 

Prevacid® 

484 

196 

Celebrex® 

161 

67 

Zoloft® 

235 

156 

a.  7,  Hay  suficiente  evidencia  para  indicar  que  el  costo 
promedio  de  medicamentos  recetados  en  Estados 
Unidos  es  diferente  del  costo  promedio  en  Canada? 
Pruebe  usando  a  =  .01. 

b.  (iCual  es  el  valor  p  aproximado  para  esta  prueba? 
(',Esto  confirma  las  conclusiones  de  usted  en  el 
inciso  a)? 


m  APPLET  trcicios 

10.116  Use  el  applet  Student’s  t  Probabilities  para 

hallar  las  siguientes  probabilidades: 

a.  P(t  >  1.2)  con  5  df 

b.  P(t  >  2)  +  P(t  <  —2)  con  10  df 

c.  P{t  <  —3.3)  con  8  df 

d.  P(t  >  .6)  con  12  df 

10.117  Use  el  applet  Student’s  t  Probabilities  para 

hallar  los  siguientes  valores  crfticos: 

a.  una  region  superior  de  rechazo  de  una  cola  con 
a  =  .05  y  11  df 

b.  una  region  de  rechazo  de  dos  colas  con  a  =  .05  y  7  df 

c.  una  region  inferior  de  rechazo  de  una  cola  con 
a  =  .01  y  15  df 

10.118  Consul te  el  applet  Interpreting  Confidence 

Intervals. 

a.  Supongamos  que  usted  tiene  una  muestra  aleatoria  de 
tamano  n  =  10  de  una  poblacion  con  media  /x 
desconocida.  ^Que  formula  usaria  para  construir 

un  intervalo  de  confianza  de  95%  para  la  media 
poblacional  desconocida? 

b.  Use  el  boton  |,R  Tii  del  primer  applet  para  crear  un  solo 
intervalo  de  confianza  de  95%  para  /x.  Use  la  formula  del 


inciso  a)  y  la  informacion  dada  en  el  applet  para  verificar 
los  lfmites  de  confianza  dados.  (El  applet  redondea  al 
entero  mas  cercano.)  ^Este  intervalo  de  confianza  encerro 
al  verdadero  valor,  /x  =  100? 

10.119  Consulte  el  applet  Interpreting  Confidence 

Intervals. 

a.  Use  el  boton  ***»*  del  primer  applet  para  crear  10 
intervalos  de  confianza  de  95%  para  /x. 

b.  ('  Todos  los  anchos  de  estos  intervalos  son  iguales? 
Explique  por  que  si  o  por  que  no. 

c.  ('.Cuantos  de  los  intervalos  funcionan  correctamente  y 
encierran  el  verdadero  valor  de  pP 

d.  Intente  de  nuevo  esta  simulation  al  dar  un  clic  en 

el  boton  una  cuantas  veces  mas  y  contar  el 

numero  de  intervalos  que  funcionan  correctamente. 

(:,Es  cercano  a  nuestro  nivel  de  confianza  de  95  %? 

e.  Use  el  boton  nilU  del  segundo  applet  para  crear 
10  intervalos  de  confianza  de  99%  para  p.  ^Cuantos 
de  estos  intervalos  funcionan  correctamente? 

10.120  Consulte  el  applet  Interpreting  Confidence 

Intervals. 

a.  Use  el  boton  mm  para  crear  100  intervalos  de 
confianza  de  95%  para  p.  ^Cuantos  de  los  intervalos 
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funcionan  correctamente  y  encierran  el  verdadero 
valor  de  /x‘? 

b.  Repita  las  instrucciones  del  inciso  a)  para  construir 
intervalos  de  confianza  de  99%.  ,'Cuantos  de 

los  intervalos  funcionan  correctamente  y  encierran 
el  verdadero  valor  de  pP. 

c.  Intente  de  nuevo  esta  simulacion  al  dar  un  clic  en  el 

boton  unas  cuantas  veces  mas  y  contar  el 

numero  de  intervalos  que  funcionan  correctamente. 
Use  intervalos  de  confianza  de  95%  y  99%.  (',EI 
porcentaje  de  intervalos  que  funcionan  se  acercan  a 
nuestros  niveles  de  confianza  de  95%  y  99%? 

10.121  Una  muestra  aleatoria  de  n  =  12  observaciones 
de  una  poblacion  normal  produjo  x  =  47.1  y  s2  =  4.7. 
Pruebe  la  hipotesis  H0 :  /x  =  48  contra  Ha  :  p  J=  48.  Use 
el  applet  Small-Sample  Test  of  a  Population  Mean  y  un 
nivel  de  significancia  de  5%. 

10.122  Calificaciones  del  SAT  En  el  ejercicio  9.73, 
informamos  que  el  promedio  nacional  de  calificaciones 
del  SAT  para  la  generacion  de  2005  fue  508  en  lectura  y 
520  en  matematicas.  Suponga  que  tenemos  una  pequena 
muestra  aleatoria  de  15  estudiantes  de  California  de 

la  generacion  de  2005;  sus  calificaciones  del  SAT  se 
registraron  en  la  tabla  siguiente: 

Lectura  Matematicas 

Promedio  muestral  499  516 

Desviacion  muestral  estandar  98  96 

a.  Use  el  applet  Small-Sample  Test  of  a  Population 
Mean.  (jLos  datos  dan  suficiente  evidencia  para 
indicar  que  el  promedio  de  calificacion  de  lectura, 
para  todos  los  estudiantes  de  California  de  la 
generacion  2005,  es  diferente  del  promedio  nacional? 
Pruebe  usando  a  =  .05. 


b.  Use  el  applet  Small-Sample  Test  of  a  Population 
Mean.  (;Los  datos  dan  suficiente  evidencia 
para  indicar  que  el  promedio  de  calificacion  de 
matematicas,  para  todos  los  estudiantes  de  California 
de  la  generacion  2005,  es  diferente  del  promedio 
nacional?  Pruebe  usando  a  =  .05. 

10.123  Tiempos  de  recuperacion  de  una  cirugia 

El  tiempo  de  recuperacion  se  registro  para  pacientes 
asignados  al  azar  y  sometidos  a  dos  procedimientos 
quirurgicos  diferentes.  Los  datos  (registrados  en  dfas)  son 
como  sigue: 


Procedimiento  1 

Procedimiento  II 

Promedio  muestra 

7.3 

8.9 

Varianza  muestral 

1.23 

1.49 

Tamano  muestral 

11 

13 

(■,Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  entre  los  tiempos  medios  de  recuperacion 
para  los  dos  procedimientos  quirurgicos?  Efectue 
la  prueba  de  hipotesis,  calculando  manualmente  el 
estadfstico  de  prueba  y  el  valor  p  aproximado.  A 
continuation  verifique  sus  resultados  usando  el  applet 
Two-Sample  T-Test:  Independent  Samples. 

10.124  Precios  de  acciones  Consulte  el  ejercicio 
10.104  en  el  que  informamos  los  precios  al  cierre  de  dos 
acciones  comunes,  registrados  en  un  perfodo  de  15  dfas. 

X{  =  40.33  X2  =  42.54 
s,  =  1.54  si  =  2.96 

Use  el  applet  Two-Sample  T-Test:  Independent 
Samples.  (',Los  datos  dan  suficiente  evidencia  para 
indicar  que  los  precios  promedio  de  las  dos  acciones 
comunes  son  diferentes?  Use  el  valor  p  para  tener  acceso 
a  la  significancia  de  la  prueba. 


CASO 

prActico 


datos  Horario  flexible 


£l_e  gustaria  una  semana  de  cuatro  dfas 
de  trabajo? 

(,Un  horario  flexible  en  una  semana  de  trabajo  resulta  en  beneficios  positivos  para  emplea- 
dores  y  empleados?  ^Es  probable  que  un  empleado  mas  descansado,  que  pasa  menos 
tiempo  en  transporte  de  su  casa  a  su  trabajo,  sea  mas  eficiente  y  tome  menos  dfas  con  per- 
miso  por  enfermedad  y  asuntos  personales?  Un  informe  sobre  los  beneficios  de  horarios 
flexibles  de  trabajo,  que  aparecio  en  Environmental  Health,  vio  los  registros  de  n  =  11 
empleados  que  trabajaban  en  una  oficina  sucursal  del  departamento  de  salud  publica  en 
Illinois  bajo  un  horario  de  semana  de  cuatro  dfas  de  trabajo.19  Los  empleados  trabajaron 
una  semana  convencional  de  trabajo  en  el  ano  1,  asf  como  una  semana  de  cuatro  dfas  de 
trabajo  en  el  ano  2.  Algunas  estadfsticas  para  estos  empleados  se  muestran  en  la  tabla 
siguiente: 
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Empleado 

Permiso  asuntos  personales 

Permiso  por  enfermedad 

Ano  2 

Ano  1 

Ano  2 

Ano  1 

1 

26 

33 

30 

37 

2 

18 

37 

61 

45 

3 

24 

20 

59 

56 

4 

19 

26 

2 

9 

5 

17 

1 

79 

92 

6 

34 

2 

63 

65 

7 

19 

13 

71 

21 

8 

18 

22 

83 

62 

9 

9 

22 

35 

26 

10 

36 

13 

81 

73 

11 

26 

18 

79 

21 

1.  Una  semana  de  trabajo  de  cuatro  dfas  asegura  que  el  empleado  tendra  un  dfa  mas 
que  no  es  necesario  pasar  en  el  trabajo.  Un  posible  resultado  es  una  reduction  en  el 
numero  promedio  de  dfas  de  permiso  por  asuntos  personales  tornados  por  empleados 
en  un  horario  de  trabajo  de  cuatro  dfas.  ^Los  datos  indican  que  este  es  el  caso?  Use  el 
metodo  del  valor  p  con  el  fin  de  probar  para  llegar  a  su  conclusion. 

2.  Un  horario  de  semana  de  trabajo  de  cuatro  dfas  podrfa  tambien  tener  un  efecto  sobre  el 
numero  promedio  de  dfas  de  permiso  por  enfermedad  que  tome  un  empleado.  ^Debe 
usarse  una  alternativa  direccional  en  este  caso?  7,  Por  que  sf  o  por  que  no? 

3.  Construya  un  intervalo  de  confianza  de  95%  para  estimar  el  promedio  de  diferencia 
en  dfas  tornados  por  enfermedad  entre  estos  dos  anos.  ^Que  concluye  usted  acerca  de 
la  diferencia  entre  el  numero  promedio  de  dfas  de  permiso  por  enfermedad  para  estos 
dos  horarios  de  trabajo? 

4.  Con  base  en  el  analisis  de  estas  dos  variables,  7,  que  se  puede  concluir  acerca  de  las 
ventajas  de  un  horario  de  semana  de  trabajo  de  cuatro  dfas? 


Caso  practico  de  “Four-Day  Work  Week  Improves  Environment”,  por  C.S.  Catlin,  Environmental  Health , 
Vol.  59,  No.  7,  marzo  de  1997.  Copyright  1997  National  Environmental  Health  Association.  Reimpreso  con 
permiso. 
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OBJETIVOS  GENERALES 

La  cantidad  de  informacion  contenida  en  una  muestra 
es  afectada  por  diversos  factores  que  el  experimentador 
puede  o  no  puede  ser  capaz  de  controlar.  Este  capitulo 
introduce  tres  disehos  experimentales  diferentes,  dos 
de  los  cuales  son  extensiones  directas  de  los  disenos  no 
apareados  y  apareados  del  capitulo  10.  Una  nueva  tecnica 
llamada  anaiisis  de  varianza  se  utiliza  para  determinar  el 
modo  en  que  diferentes  factores  experimentales  afectan 
el  promedio  de  respuesta. 


IN  DICE  DEL  CAPITULO 

El  anaiisis  de  varianza  (1 1 .2) 

El  diseiio  completamente  aleatorizado  (1 1.4,  11 .5) 
Experimentos  factoriales  (1 1.9,  11 .10) 

El  diseno  por  bloques  aleatorizados  (1 1.7,  11 .8) 
Metodo  de  Tukey  de  comparaciones  pareadas  (1 1 .6) 


ENTRENADOR  PERSONAL 


^Corno  se  si  mis  calculos  son  precisos? 


W)  "Un  buen  desorden" 

ySe  arriesga  usted  a  ser  multado  por  estacionar  su 
auto  en  zonas  rojas  o  junto  a  hidrantes?  ^No  pone 
suficiente  dinero  en  el  parquimetro?  Si  es  ast,  esta 
entre  los  miles  de  conductores  que  reciben  in- 
fracciones  a  diario  en  casi  todas  las  ciudades  en  Es- 
tados  Unidos.  Dependiendo  de  la  ciudad  en  la  que 
reciba  una  infraccion,  su  multa  puede  ser  de  solo  $8 
por  exceso  de  tiempo  de  estacionamiento  en  San 
Luis  Obispo,  California,  hasta  $340  por  estacio- 
narse  ilegalmente  en  espacio  para  discapacitados 
en  San  Diego,  California.  El  estudio  practico  del 
final  de  este  capitulo  analiza  estadfstic  ament  e  la 
variation  en  multas  de  estacionamiento  en  ciuda¬ 
des  del  sur  de  California. 
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EL  DISENO  DE  UN  EXPERIMENTO 

La  forma  en  que  una  muestra  sea  seleccionada  se  denomina  plan  de  muestreo  o  diseno 
experimental  y  determina  la  cantidad  de  informacion  en  la  muestra.  Algunas  investiga- 
ciones  comprenden  un  estudio  observacional,  en  las  que  el  investigador  no  produce  en 
realidad  los  datos  sino  que  solo  observa  las  caracterfsticas  de  datos  que  ya  existen.  Casi 
todos  los  estudios  muestrales,  en  donde  se  reune  informacion  con  un  cuestionario,  caen 
en  esta  categorfa,  el  investigador  forma  un  plan  para  recolectar  los  datos,  llamado  plan 
de  muestreo  y  a  continuation  utiliza  los  procedimientos  estadfsticos  apropiados  para 
sacar  conclusiones  acerca  de  la  poblacion  o  poblaciones  de  donde  proviene  la  muestra. 

Otra  investigation  comprende  la  experimentation.  El  investigador  puede  delibera- 
damente  imponer  una  o  mas  condiciones  experimentales,  en  las  unidades  experimen- 
tales,  para  determinar  su  efecto  en  la  respuesta.  Veamos  ahora  algunos  terminos  nuevos 
que  usaremos  para  discutir  el  diseno  de  un  experimento  estadfstico. 


Definicion  Una  unidad  experimental  es  el  objeto  en  el  que  se  toma  una  medicion 
(o  mediciones). 

Un  factor  es  una  variable  independiente  cuyos  valores  son  controlados  y  variados  por 
el  experimentador. 

Un  nivel  es  el  escenario  de  intensidad  de  un  factor. 

Un  tratamiento  es  una  combination  especffica  de  niveles  de  factor. 

La  respuesta  es  la  variable  que  es  medida  por  el  experimentador. 


Un  grupo  de  personas  se  divide  al  azar  en  un  grupo  experimental  y  uno  de  control.  A1 
grupo  de  control  se  le  da  un  examen  de  aptitud  despues  de  haber  tornado  un  desayuno 
completo;  al  grupo  experimental  se  le  da  el  mismo  examen  sin  haber  tornado  ningun 
desayuno.  Cuales  son  los  factores,  niveles  y  tratamientos  en  este  experimento? 


Solucion  Las  unidades  experimentales  son  las  personas  en  las  que  la  respuesta  (cali- 
ficacion  de  examen)  se  mide.  El  factor  de  interes  podrfa  describirse  como  “comida”  y 
tiene  dos  niveles :  “desayuno”  y  “no  desayuno”.  Como  este  es  el  unico  factor  controlado 
por  el  experimentador,  los  dos  niveles  de  “desayuno”  y  “no  desayuno”  tambien  repre- 
sentan  los  tratamientos  de  interes  en  el  experimento. 


Suponga  que  el  experimentador  del  ejemplo  11.1  empezo  por  seleccionar  al  azar  20 
hombres  y  20  mujeres  para  el  experimento.  Estos  dos  grupos  se  dividieron  entonces  al 
azar  en  10  cada  uno  para  los  grupos  experimental  y  de  control.  ^Cuales  son  los  factores, 
niveles  y  tratamientos  en  este  experimento? 

Solucion  Ahora  hay  dos  factores  de  interes  para  el  experimentador  y  cada  factor 
tiene  dos  niveles : 

•  “Genero”  a  dos  niveles:  hombres  y  mujeres 

•  “Comida”  a  dos  niveles:  desayuno  y  no  desayuno 

En  este  experimento  mas  complejo,  hay  cuatro  tratamientos,  uno  para  cada  combination 
especffica  de  niveles  de  factor:  hombres  sin  desayuno,  hombres  con  desayuno,  mujeres 
sin  desayuno  y  mujeres  con  desayuno. 
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En  este  capftulo,  nos  concentraremos  en  experimentos  que  han  sido  disenados  en  tres 
formas  diferentes  y  usaremos  una  tecnica  llamada  andlisis  de  varianza  para  juzgar  los 
efectos  de  varios  fact  ores  en  la  respuesta  experimental.  Dos  de  estos  disenos  experimen- 
tales  son  extensiones  de  los  disenos  no  apareados  y  apareados  del  capftulo  10. 


iQUE  ES  UN  ANALISIS  DE  VARIANZA? 

Las  respuestas  que  se  generan  en  una  situation  experimental  siempre  exhiben  cierta 
cantidad  de  variabilidad.  En  un  analisis  de  varianza,  se  divide  la  variation  total  de  las 
mediciones  de  respuesta  en  partes  que  pueden  ser  atribuidas  a  varios  factores  de  inte¬ 
rns  para  el  experimentador.  Si  el  experimento  ha  sido  debidamente  diseiiado,  estas 
partes  pueden  usarse  entonces  para  contestar  preguntas  acerca  de  los  efectos  de  los 
diversos  factores  en  la  respuesta  de  interes. 

Se  puede  entender  mejor  la  logica  que  sirve  de  base  a  un  analisis  de  varianza  al  ver 
un  experimento  sencillo.  Considere  dos  conjuntos  de  muestras  seleccionadas  al  azar  de 
las  poblaciones  1  (♦)  y  2  (O),  cada  uno  con  pares  identicos  de  medias;  x,  y  x2.  Los  dos 
conjuntos  se  muestran  en  la  bgura  11.1.  £ Es  mas  facil  detectar  la  diferencia  en  las 
dos  medias  cuando  se  vea  el  conjunto  A  o  el  conjunto  B?  Es  probable  que  este  de  acuerdo 
en  que  el  conjunto  A  muestra  la  diferencia  mucho  mas  claramente.  En  el  conjunto  A,  la 
variabilidad  de  las  mediciones  dentro  de  los  grupos  (los  ♦  y  O)  es  mucho  menor  que 
la  variabilidad  entre  los  dos  grupos.  En  el  conjunto  B,  hay  mas  variabilidad  dentro  de  los 
grupos  (los  ♦  y  O),  causando  que  los  dos  grupos  se  “mezclen”  y  hagan  mas  diffcil  ver 
la  diferencia  identica  en  las  medias. 


FIGURA  11.1 

Dos  conjuntos  de  muestras 
con  las  mismas  medias 


Conjunto  A 


Conjunto  B 


o  o  o  ♦  ♦  ♦ 


o  ♦  o  ♦  o  ♦ 


La  comparacion  que  ha  hecho  intuitivamente  es  formalizada  por  el  analisis  de 
varianza.  Es  mas,  el  analisis  de  varianza  se  puede  hacer  no  solo  para  comparar  dos 
medias  sino  tambien  para  hacer  comparaciones  de  mas  de  dos  medias  poblacionales  y 
para  determinar  los  efectos  de  varios  factores  en  disenos  experimentales  mas  complejos. 
El  analisis  de  varianza  se  apoya  en  estadfsticas  con  distribuciones  muestrales  que  son 
modeladas  por  la  distribution  F  de  la  section  10.7. 


LAS  SUPOSICIONES  PARA  UN  ANALISIS 
DE  VARIANZA 

Las  suposiciones  necesarias  para  un  analisis  de  varianza  son  semejantes  a  las  requeri- 
das  para  las  estadfsticas  t  de  Student  y  F  del  capftulo  10.  Cualquiera  que  sea  el  diseno 
experimental  empleado  para  generar  los  datos,  se  debe  suponer  que  las  observaciones 
dentro  de  cada  grupo  de  tratamiento  estan  normalmente  distribuidas  con  una  varianza 
comun  (F.  Al  igual  que  en  el  capftulo  10,  el  analisis  de  procedimientos  de  varianza  es 
mas  bien  robusto  cuando  los  tamanos  muestrales  son  iguales  y  cuando  los  datos  son  de 
forma  de  montfculo.  Violar  la  suposicion  de  una  varianza  comun  es  mas  serio,  en  espe¬ 
cial  cuando  los  tamanos  muestrales  no  son  cercanamente  iguales. 
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E  J  E  M  P  L 


SUPOSICIONES  PARA  ANALISIS  DE  EXAMEN 
DE  VARIANZA  Y  PROCEDIMIENTOS  DE  ESTIMACION 

•  Las  observaciones  dentro  de  cada  poblacion  estan  distribuidas  normalmente  con 
una  varianza  comiin  a2. 

•  Las  suposiciones  respecto  al  procedimiento  de  muestreo  son  especificadas  para 
cada  diseno  en  las  secciones  que  siguen. 

Este  capitulo  describe  el  analisis  de  varianza  para  tres  disenos  experimentales  dife- 
rentes.  El  primer  diseno  esta  basado  en  muestreo  aleatorio  independiente  de  varias 
poblaciones  y  es  una  extension  de  la  prueba  t  no  pareada  del  capitulo  10.  El  segundo 
es  una  extension  del  diseno  de  diferencia  pareada  o  pares  acoplados  y  comprende  una 
asignacion  aleatoria  de  tratamientos  dentro  de  conjuntos  apareados  de  observaciones. 
El  tercero  es  un  diseno  que  permite  juzgar  el  efecto  de  dos  factores  experimentales  en 
la  respuesta.  Los  procedimientos  de  muestreo  necesarios  para  cada  diseno  se  vuelven  a 
expresar  en  sus  secciones  respectivas. 

EL  DISENO  COMPLETAMENTE 
ALEATORIZADO:  UNA  CLASIFICACION 
EN  UNA  DIRECCION 

Uno  de  los  disenos  experimentales  mas  sencillos  es  el  diseno  completamente  aleato- 
rizado,  en  el  que  muestras  aleatorias  se  seleccionan  de  manera  independiente  de  cada 
una  de  k  poblaciones.  Este  diseno  comprende  solo  un  factor ,  la  poblacion  de  donde 
proviene  la  medicion,  de  aqui  la  designation  como  una  clasificacion  en  una  direction. 
Hay  k  niveles  diferentes  correspondientes  a  las  k  poblaciones,  que  tambien  son  los  trata¬ 
mientos  para  esta  clasificacion  de  una  direction,  i  Las  k  medias  poblacionales  son  todas 
iguales,  o  al  menos  una  media  es  diferente  de  las  otras? 

(',Por  que  se  necesita  un  nuevo  procedimiento,  el  analisis  de  varianza,  para  comparar 
las  medias  poblacionales  cuando  ya  se  tiene  disponible  la  prueba  t  de  Student?  Al  com¬ 
parar  k  =  3  medias,  se  podrfa  probar  cada  uno  de  los  tres  pares  de  hipotesis: 

Ho —  p>2  Ho :  M-i  =  /x3  H0 :  /x2  =  /x3 

para  averiguar  donde  estan  las  diferencias.  No  obstante,  se  debe  recordar  que  cada  prue¬ 
ba  que  se  realice  esta  sujeta  a  la  posibilidad  de  error.  Para  comparar  k  =  4  medias,  se 
necesitarian  seis  pruebas  y  se  necesitarfan  10  pruebas  para  comparar  k  =  5  medias. 
Cuantas  mas  pruebas  se  realicen  en  un  conjunto  de  mediciones,  mas  probable  sera  que  al 
menos  una  de  las  conclusiones  sea  incorrecta.  El  analisis  de  procedimiento  de  varianza 
provee  una  prueba  general  para  juzgar  la  igualdad  de  las  k  medias  poblacionales.  Una 
vez  que  haya  determinado  si  hay  en  realidad  una  diferencia  en  las  medias,  se  puede  usar 
otro  procedimiento  para  averiguar  donde  estan  las  diferencias. 

^Como  se  pueden  seleccionar  estas  k  muestras  aleatorias?  A  veces  las  poblaciones 
existen  en  realidad  y  se  puede  usar  un  generador  computarizado  de  numeros  aleatorios 
o  una  tabla  de  numeros  aleatorios  para  seleccionar  al  azar  las  muestras.  Por  ejemplo,  en 
un  estudio  para  comparar  los  tamanos  promedio  de  reclamaciones  de  seguro  medico 
en  cuatro  estados  diferentes,  se  podrfa  usar  una  base  de  datos  computarizada  proporcio- 
nada  por  las  companfas  de  seguros  medicos  para  seleccionar  muestras  aleatorias  de  los 
cuatro  estados.  En  otras  situaciones,  las  poblaciones  pueden  ser  hipoteticas  y  se  pueden 
generar  respuestas  solo  despues  de  haberse  aplicado  los  tratamientos  experimentales. 

Un  investigador  esta  interesado  en  los  efectos  de  cinco  tipos  de  insecticidas  a  usar  para 
controlar  el  gorgojo  del  algodon  en  campos  algodoneros.  Explique  como  poner  en 
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practica  un  diseno  completamente  aleatorizado  para  investigar  los  efectos  de  los  cinco 
insecticidas  en  produccion  de  cosechas. 

Solucion  La  unica  forma  de  generar  el  equivalente  de  cinco  muestras  aleatorias  de 
las  poblaciones  hipoteticas,  correspondientes  a  los  cinco  insecticidas,  es  usar  un  meto- 
do  llamado  asignacion  aleatorizada.  Se  escoge  un  numero  fijo  de  plantas  de  algodon 
para  tratamiento  y  a  cada  una  se  le  asigna  un  numero  aleatorio.  Suponga  que  cada  mues- 
tra  debe  tener  un  numero  igual  de  tratamientos.  Con  el  uso  de  un  medio  de  aleatoriza- 
cion,  se  pueden  asignar  las  primeras  n  plantas  escogidas  para  recibir  el  insecticida  1 ,  las 
segundas  n  plantas  para  recibir  el  insecticida  2  y  asf  sucesivamente,  hasta  que  se  hayan 
asignado  los  cinco  tratamientos. 


Ya  sea  por  selection  aleatoria  o  asignacion  aleatoria,  estos  dos  ejemplos  resultan  en 
un  diseno  completamente  aleatorizado  o  clasificacion  en  una  direction,  para  el  cual  se 
usa  el  analisis  de  varianza. 


EL  ANALISIS  DE  VARIANZA  PARA 
UN  DISENO  COMPLETAMENTE 
ALEATORIZADO 

Supongamos  que  se  desea  comparar  k  medias  poblacionales,  pc,,  pi2,  ...,  pc,,  con  base  en 
muestras  aleatorias  independientes  de  tamano  n , ,  n2,  . . . ,  nk  de  poblaciones  normales  con 
una  varianza  comiin  a2.  Esto  es,  cada  una  de  las  poblaciones  normales  tiene  la  misma 
forma,  pero  sus  ubicaciones  podrfan  ser  diferentes,  como  se  ve  en  la  figura  1 1.2. 


FIGURA  1  1  .2 

Poblaciones  normales  con 
una  varianza  comun  pero 
medias  diferentes 


Pi 


P2 


Pc 


Division  de  la  variacion  total 
en  un  experimento 

Sea  Xy  la  y-esima  medicion  (j  =  1 . 2,  . . . ,  /;,)  en  la  z'-esima  muestra.  El  analisis  de  proce- 
dimiento  de  varianza  empieza  por  considerar  la  variacion  total  en  el  experimento,  que  es 
medida  por  una  cantidad  llamada  suma  total  de  cuadrados  (TSS): 

Total  SS  =  %(xv  -  xf  =  Xx2  - 


Este  es  el  conocido  numerador  de  la  formula  para  la  varianza  muestral  para 
conjunto  de  nx  +  n2  +  •  •  •  +  nk  mediciones.  La  segunda  parte  de  la  formula  de 
se  denomina  a  veces  correccion  para  la  media  (CM).  Si  con  G  representamos 
total  de  todas  las  n  observaciones,  entonces 

(Xx,/  _ 

n 


CM  = 


todo  el 
calculo 
el  gran 


Esta  suma  total  de  cuadrados  (Total  SS)  se  divide  en  dos  componentes.  El  primer  com- 
ponente,  llamado  suma  de  cuadrados  para  tratamientos  (SST),  mide  la  variacion 
entre  las  k  medias  muestrales: 

T 2 

SST  =  Xn,(x,  -  x)2  =  Xjf  ~  CM 
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donde  Ti  es  el  total  de  observaciones  para  tratamiento  i.  El  segundo  componente,  11a- 
mado  suma  de  cuadrados  para  el  error  (SSE),  se  usa  para  medir  la  variacion  agrupada 
dentro  de  las  k  muestras: 

SSE  =  («!  —  l)s2i  +  ( n2  —  l)s22  +  ■  ■  •  +  (nk—  l)s| 

Esta  formula  es  una  extension  directa  del  numerador  en  la  formula  para  la  estimacion 
agrupada  de  cr2  del  capitulo  10.  Podemos  demostrar  algebraic amente  que,  en  el  analisis 
de  varianza, 

Total  SS  =  SST  +  SSE 

Por  tanto,  es  necesario  calcular  solo  dos  de  las  tres  sumas  de  cuadrados:  Total  SS,  SST 
y  SSE.  y  la  tercera  se  puede  hallar  por  sustraccion. 

Cada  una  de  las  fuentes  de  variacion,  cuando  es  dividida  por  sus  apropiados  grados 
de  libertad,  da  una  estimacion  de  la  variacion  en  el  experimento.  Como  Total  SS  invo- 
lucra  n  observaciones  cuadradas,  sus  grados  de  libertad  son  df  =  (n  —  1).  Del  mismo 
modo,  la  suma  de  cuadrados  para  tratamientos  comprende  k  observaciones  cuadradas  y 
sus  grados  de  libertad  son  df=(k—  1).  Por  ultimo,  la  suma  de  cuadrados  de  error,  una 
extension  directa  de  la  estimacion  agrupada  del  capitulo  10,  tiene 

df  =  («!  —  1)  +  (n2  —  1)  +  ‘  ‘  +  {n-k  —  1  )  =  n  —  k 

Observe  que  los  grados  de  libertad  para  tratamientos  y  error  son  aditivos,  es  decir, 

df  (total)  =  df  (tratamientos)  +  df  (error) 

Estas  dos  fuentes  de  variacion  y  sus  respectivos  grados  de  libertad  se  combinan  para 
formar  los  cuadraticos  medios  como  MS  =  SS  /df  La  variacion  total  en  el  experimento 
se  exhibe  entonces  en  una  tabla  de  analisis  de  varianza  (o  ANOVA). 


CONSEJO 


La  columna  marcada 
"SS"  satisface:  Total 
SS  =  SST  +  SSE. 


La  columna  marcada  "df 
siempre  asciende  an-1. 


TABLA  ANOVA  PARA  k  MUESTRAS  ALEATORIAS 
INDEPENDIENTES:  DISENO  COMPLETAMENTE 
ALEATORIZADO 

Fuente  df  SS  MS  F 

Tratamientos  k-  1  SST  MST  =  SST/(f  -  1 )  MST/MSE 

Error_ n-k  SSE  MSE  =  SSE/(n  -  k) 

Total  n  -  1  Total  SS 


donde 

Total  SS  =  tx)j  -  CM 

=  (Suma  de  cuadrados  de  todos  los  valores  x )  —  CM 


con 

CM 


&Xij)2 


Cf 

n 


SST  =  Xjr  ~  CM  MST  = 

Ui  k  —  1 

SSE  =  Total  SS  -  SST  MSE  = 


G  =  Gran  total  de  las  n  observaciones 
7)  =  Total  de  todas  las  observaciones  en  la  muestra  i 
Hi  =  Numero  de  observaciones  en  la  muestra  i 
n  =  rii  +  n2  +  •  •  •  +  nk 
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En  un  experimento  para  determinar  el  efecto  de  la  nutricion  en  intervalos  de  atencion  de 
estudiantes  de  escuelas  elementales,  un  grupo  de  15  estudiantes  se  asignaron  al  azar  a 
cada  uno  de  tres  planes  de  comidas:  no  desayuno,  desayuno  ligero  y  desayuno  completo. 
Sus  intervalos  de  atencion  (en  minutos)  se  registraron  durante  un  periodo  de  lectura  por 
la  manana  y  se  muestran  en  la  tabla  11.1.  Construya  el  analisis  de  tabla  de  varianza  para 
este  experimento. 


TABLA  11.1  Intervalos  de  atencion  de  estudiantes  despues  de  tres  planes  de  comidas 

No  desayuno  Desayuno  ligero  Desayuno  completo 


8 

14 

10 

7 

16 

12 

9 

12 

16 

13 

17 

15 

10 

11 

12 

r,  =  47 

CD 

r"> 

II 

h-L4 

T 

Solucion  Para  usar  las  formulas  de  calculo,  se  necesitan  I  os  k  =  3  tratamientos  tota- 
les  con  rii  =  n2  =  n3  =  5,  n  =  15  y  Xx,j  =  182.  Entonces 

CM  =  =  2208.2667 

Total  SS  =  (82  +  72  +  •  •  •  +  122)  -  CM  =  2338  -  2208.2667  =  129.7333 
con  (n  —  1)  =  (15  —  1)  =  14  grados  de  libertad, 

SST  =  472  +  702  +  652  _  CM  =  2266.8  -  2208.2667  =  58.5333 
con  (k  —  1)  =  (3  —  1)  =  2  grados  de  libertad,  y  por  sustraccion, 

SSE  =  Total  SS  -  SST  =  129.7333  -  58.5333  =  71.2 

con  (n  —  k)  =  (15  —  3)  =  12  grados  de  libertad.  Estas  tres  fuentes  de  variacion,  sus 
grados  de  libertad,  sumas  de  cuadrados  y  cuadraticos  medios  se  muestran  en  el  area 
sombreada  de  la  tabla  ANOVA  generada  por  MINITAB  y  se  dan  en  la  figura  11.3.  Se 
encontraran  instrucciones  para  generar  esta  salida  impresa  en  la  seccion  “Mi  MINITAB” 
al  final  de  este  capitulo. 


FIGURA  11.3 

Salida  impresa  MINITAB 
para  el  ejemplo  11.4 


ANOVA  de  una  direction:  intervalo  contra  comida 


Source 

DF 

SS 

MS 

Meal 

2 

58 . 53 

29.27 

Error 

12 

71.20 

5.93 

Total 

14 

129.73 

S  =  2. 

436 

R-Sq 

=  45.12% 

Level 

N 

Mean 

StDev 

1 

5 

9.400 

2.302 

2 

5 

14 . 000 

2 . 550 

3 

5 

13 . 000 

2 .449 

Pooled 

StDev  =  2 . 

436 

R-Sq(adj)  =  35.97% 

Individual  95%  CIs  For  Mean 
Based  on  Pooled  StDev 

( - * - ) 

( - * - ) 

( - * - ) 

7.5  10.0  12.5  15.0 
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La  salida  impresa  MINITAB  da  alguna  informacion  adicional  sobre  la  variacion  en  el 
experimento.  La  segunda  seccion  muestra  las  medias  y  desviaciones  estandar  para  los 
tres  planes  de  comidas.  Mas  importante  aun  es  que  se  puede  ver  en  la  primera  seccion 
de  la  salida  impresa  dos  columnas  marcadas  “F”  y  “P”.  Podemos  usar  estos  valores  para 
probar  una  hipotesis  respecto  a  la  igualdad  de  las  tres  medias  de  tratamiento. 


Prueba  de  la  igualdad  de  las  medias 
de  tratamiento 

Los  cuadrdticos  medios  en  el  analisis  de  tabla  de  varianza  se  pueden  usar  para  probar  la 
hipotesis  nula 

H0:  fii  =  /x,2  =  •  •  •  =  /r* 

contra  la  hipotesis  alternativa 

Ha  :  A1  menos  una  de  las  medias  es  diferente  de  las  otras 

usando  el  siguiente  argumento  teorico: 

•  Recuerde  que  cr2  es  la  varianza  comun  para  todas  las  poblaciones  k.  La  cantidad 

MSE  =  ~^T 
n  —  k 

es  una  estimacion  agrupada  de  cr2,  un  promedio  ponderado  de  todas  las  varianzas 
muestrales  k,  sea  o  no  sea  H0,  verdadera. 

•  Si  H0  es  verdadera,  entonces  la  variacion  en  las  medias  muestrales,  medida  por 
MST  =  [SST/(&  —  1)]  tambien  da  una  estimacion  insesgada  de  or.  No  obstante, 
si  H0  es  falsa  y  las  medias  poblacionales  son  diferentes,  entonces  MST,  que 
mide  la  variacion  en  las  medias  muestrales,  sera  inusualmente  grande,  como  se 
ve  en  la  figura  1 1 .4. 


FIGURA  1  1  .4 

Medias  muestrales 
sacadas  de  poblaciones 
identicas  contra  diferentes 


H2 


b3 


MS  =  SS  Idf 


Las  pruebas  Fpara  tablas 
AIMOVA  son  siempre  de  cola 
superior  (derecha). 


•  La  prueba  estadfstica 
MST 
~~  MSE 

tiende  a  ser  mas  grande  que  lo  normal  si  H0  es  falsa.  En  consecuencia,  se  puede 
rechazar  H0  para  valores  grandes  de  F,  usando  una  prueba  estadfstica  de  cola 
derecha.  Cuando  H0  es  verdadera,  esta  prueba  estadfstica  tiene  una  distribucion  F 
con  dfi  =  {k  —  1)  y  df2  =  (n  —  k)  grados  de  libertad  y  se  pueden  usar  valores  crf- 
ticos  de  cola  derecha  de  la  distribucion  F  (de  la  tabla  6  del  apendice  I)  o  valores 
p  generados  por  computadora,  para  sacar  conclusiones  estadfsticas  acerca  de  la 
igualdad  de  las  medias  poblacionales. 
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E  J  E  M  P  L 


PRUEBA  F  PARA  COMPARAR  K  MEDIAS 
POBLACIONALES 

1 .  Hipotesis  nula:  H0 :  p,2  =  ijl2  =  •  •  •  =  fJLk 

2.  Hipotesis  alternativa:  Ha :  Uno  o  mas  pares  de  medias  poblacionales  difieren 

3.  Prueba  estadfstica:  F  =  MST/MSE,  donde  F  esta  basada  en  df\  =  (k  —  1) 
y  df2  =  (n  —  k) 

4.  Region  de  rechazo:  rechazar  H0  si  F  >  Fa,  donde  Fa  se  encuentra  en  la  cola  supe¬ 
rior  de  la  distribucion  F  (con  df  =  k  —  I  y  df2  =  n  —  k)  o  si  cl  valor 

p  <  a. 


Suposiciones 

•  Las  muestras  son  seleccionadas  al  azar  y  en  forma  independiente  de  sus  respecti- 
vas  poblaciones. 

•  Las  poblaciones  estan  normalmente  distribuidas  con  /jl2,  ■  ■  ■ ,  Pi  y  varianzas 
iguales,  a\  =  a\  =  ■  •  •  =  a\  =  a2. 


° 

Para  probar  H0:  /r,  =  p,2  =  p,  contra  la  hipotesis  alternativa  de  que  el 
promedio  de  intervalo  de  atencion  es  diferente  para  al  menos  uno  de  los  tres  tratamien- 
tos,  se  usa  el  analisis  de  varianza  estadfstica  de  F,  calculada  como 

rr  MST  29.2667  , 

F  =  MSE=T9333-  =  4-93 

y  se  muestra  en  la  columna  marcada  “F”  de  la  figura  1 1.3.  No  es  de  sorprender  saber 
que  el  valor  en  la  columna  marcada  “P”  en  la  figura  1 1.3  sea  el  valor  p  exacto  para  esta 
prueba  estadfstica. 

La  prueba  estadfstica  MST/MSE  calculada  lfneas  antes,  tiene  una  distribucion  F  con 
dfi  =  2  y  df2  =  12  grados  de  libertad.  Con  el  uso  del  metodo  del  valor  crftico  con  a  = 
.05,  se  puede  rechazar  H0  si  F  >  F05  =  3.89  de  la  tabla  6  del  apendice  I  (vease  la  figura 
11.5).  Como  el  valor  observado,  F  =  4.93,  excede  del  valor  crftico,  se  rechaza  H0.  Hay 
suficiente  evidencia  para  indicar  que  al  menos  uno  de  los  tres  intervalos  de  atencion 
promedio  es  diferente  de  al  menos  uno  de  los  otros. 


/Los  datos  del  ejemplo  11.4  dan  suficiente  evidencia  para  indicar  una  diferencia  en 
el  promedio  de  intervalos  de  atencion,  dependiendo  del  tipo  de  desayuno  tornado  por  el 
estudiante? 
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FIGURA  1  1  .5 

Region  de  rechazo  para  el 
ejemplo  11.5 


/(f) 


3.89 


Las  salidas  impresas  de 
computadora  dan  el  valor  p 
exacto;  use  el  valor  p  para 
tomar  su  decision. 


Se  podrfa  haber  llegado  a  esta  misma  conclusion  usando  el  valor  p  exacto,  P  =  .027, 
dado  en  la  figura  1 1.3.  Como  el  valor  p  es  menor  a  a  =  .05,  los  resultados  son  estadfsti- 
camente  significativos  al  nivel  de  5%.  Todavfa  se  concluye  que  al  menos  uno  de  los  tres 
intervalos  de  atencion  es  diferente  de  al  menos  uno  de  los  otros. 


Todavfa  se  puede  usar  el  applet  F  Probabilities  para  hallar  valores  crfticos  de  F  o 
valores  p  para  el  analisis  de  pruebas  F  de  varianza.  Vea  los  dos  applets  de  la  bgura 
1 1.6.  Use  el  cursor  a  la  izquierda  y  derecha  de  los  applets  para  seleccionar  los  grados 
de  libertad  apropiados  (dfx  y  df2).  Para  hallar  el  valor  crftico  para  el  rechazo  de  H0, 
introduzca  el  nivel  de  signibcancia  a  en  la  caja  marcada  “Prob”  y  pulse  Enter.  Para 
hallar  el  valor  p,  introduzca  el  valor  observado  de  la  prueba  estadfstica  en  la  caja 
marcada  “F”  y  pulse  Enter.  ^Puede  identihcar  el  valor  crftico  para  rechazo  y  el  valor 
p  para  el  ejemplo  1 1.5? 


FIGURA  1  1  .6 

Applet  F Probabilities 


^Distribution  F  Distribution 


d 

d 

d 

\ 

dfi  =  2 

df2  =  12 

ifi  =  2 

dt2  =  12 

\ 

\ 

J 

J 

J 

d 

i 

9 

3.89  F  T 

d 

1 

9 

4.93  F  T 

F  |3.89 

Prob  Jo .05 

F  |4.93 

Prob  |o.0274 

Estimacion  de  diferencias  en  las  medias 
de  tratamiento 

La  siguiente  pregunta  obvia  que  se  podrfa  hacer  se  rebere  a  la  naturaleza  de  las  diferen¬ 
cias  de  las  medias  poblacionales.  ^Cuales  medias  son  diferentes  de  las  otras?  ^Como  se 
puede  estimar  la  diferencia  o  posiblemente  las  medias  individuales  para  cada  uno  de  los 
tres  tratamientos?  En  la  section  1 1 .6,  presentaremos  un  procedimiento  que  se  puede  usar 
para  comparar  todos  los  posibles  pares  de  medias  de  tratamiento  simultaneamente.  No 
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obstante,  si  hay  un  interes  especial  en  una  media  particular  o  par  de  medias,  se  pueden 
construir  intervalos  de  confianza  usando  los  procedimientos  de  muestra  pequena  del 
capitulo  10,  con  base  en  la  distribution  t  de  Student.  Para  una  sola  media  poblacional, 
el  intervalo  de  confianza  es 


donde  i,  es  la  media  muestral  para  el  /-esimo  tratamiento.  Del  mismo  modo,  para  una 
comparacion  de  dos  medias  poblacionales,  por  ejemplo  /jli  y  pq,  el  intervalo  de  confianza 
es  , _ 

(x,  -  xj)  ±  t^Js2^  + 

Antes  de  que  se  puedan  usar  estos  intervalos  de  confianza,  sin  embargo,  persisten  dos 
preguntas: 

•  (  Como  se  calcula  5  o  5',  la  mejor  estimacion  de  la  varianza  comun  cr2? 

•  (  Cuantos  grados  de  libertad  se  usan  para  el  valor  cntico  de  f? 

Para  contestar  estas  preguntas,  recuerde  que  en  un  analisis  de  varianza,  el  cuadratico 
medio  de  error,  MSE,  siempre  da  un  estimador  insesgado  de  cr  y  usa  information  de 
todo  el  conjunto  de  mediciones.  En  consecuencia,  es  el  mejor  estimador  de  cr,  cual- 
quiera  que  sea  el  procedimiento  de  estimacion  que  se  use.  Siempre  se  debe  usar 

s2  =  MSE  con  df=(n  —  k ) 

para  estimar  a2.  Se  puede  hallar  la  raiz  cuadrada  positiva  de  este  estimador,  .v  =  V MSE. 
en  el  ultimo  renglon  de  la  figura  1 1.3  marcado  “Pooled  StDev”. 


CONSEJO 


Los  grados  de  libertad  para 
intervalos  de  confianza  son 
los  df  de  error. 


DISENO  COMPLETAMENTE  ALEATORIZADO: 
INTERVALOS  DE  CONFIANZA  (1  -  a)100%  PARA 
UNA  SOLA  MEDIA  DE  TRATAMIENTO  Y  LA 
DIFERENCIA  ENTRE  DOS  MEDIAS  DE  TRATAMIENTO 


Una  sola  media  de  tratamiento: 


Diferencia  entre  dos  medias  de  tratamiento: 


(x<  xi )  —  ^al2\l s  l  rii  n. 


con 

5  =  V7  =  VMSE  = 

V  n  k 


donde  n  =  n{  +  n2  +  ■  ■  ■  +  nk y  ta/2  esta  basada  en  (n  —  k)  df. 

El  investigador  del  ejemplo  1 1.4  cree  que  los  estudiantes  que  no  toman  desayuno  ten- 
dran  intervalos  de  atencion  significativamente  mas  cortos,  pero  que  puede  no  haber  dife¬ 
rencia  entre  aquellos  que  toman  un  desayuno  ligero  o  un  desayuno  completo.  Encuentre 
un  intervalo  de  confianza  de  95%  para  el  promedio  de  intervalo  de  atencion  para  estu¬ 
diantes  que  no  toman  desayuno,  asf  como  un  intervalo  de  confianza  para  la  diferencia  en 
los  intervalos  de  atencion  promedio  para  quienes  toman  desayuno  ligero  contra  los  de 
desayuno  completo. 
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Para  s2  =  MSE  =  5.9333  para  que  a  =  V5.9333  =  2.436  con  df  = 
(n  —  k)  =  12,  se  pueden  calcular  los  dos  intervalos  de  confianza: 

•  Para  los  de  no  desayuno: 


x,  ± 


9.4  ± 


2.1791 


2.436\ 

VsJ 


9.4  ±  2.37 


o  sea,  entre  7.03  y  1 1.77  minutos. 

•  Para  los  de  desayuno  ligero  contra  desayuno  completo: 

(x2  -  x3)  ±  ls2^_  + 

(14  -  13)  ±  2.179  ,5.9333^  + 


1  ±  3.36 

una  diferencia  de  entre  —2.36  y  4.36  minutos. 

Se  puede  ver  que  el  segundo  intervalo  de  confianza  no  indica  una  diferencia  en  el  pro- 
medio  de  intervalos  de  atencion,  para  estudiantes  que  tomaron  desayuno  ligero  contra 
los  de  desayuno  completo,  como  sospechaba  el  investigador.  Si  el  investigador,  antes  de 
creencias  previas,  desea  probar  los  otros  posibles  pares  de  medias,  es  decir  no  desayuno 
contra  desayuno  ligero  y  no  desayuno  contra  desayuno  completo,  los  metodos  dados  en 
la  seccion  1 1.6  deben  usarse  para  probar  los  tres  pares. 


Algunos  programas  de  computadora  tienen  opciones  de  graficas  que  dan  una  exce- 
lente  descripcion  visual  de  datos  y  las  k  medias  de  tratamiento.  Una  de  estas  opciones  en 
el  programa  MINITAB  se  ve  en  la  figura  1 1.7.  Las  medias  de  tratamiento  estan  indicadas 
por  el  slmbolo  ©  y  estan  conectadas  con  rectas.  Observe  que  la  media  “no  desayuno” 
parece  ser  un  poco  diferente  de  las  otras  dos  medias,  como  sospechaba  el  investigador, 
aun  cuando  hay  un  pequeno  traslape  en  las  graficas  de  caja.  En  la  siguiente  seccion,  pre- 
sentamos  un  procedimiento  formal  para  probar  la  significancia  de  las  diferencias  entre 
todos  los  pares  de  medias  de  tratamiento. 


FIGURA  11.7 

Graficas  de  caja  para  el 
ejemplo  11.6 


Boxplot  of  Span  by  Meal 


Meal 
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1 


ENTRENADOR  PERSONAL 

iComo  se  si  mis  calculos  son  precisos? 

Las  siguientes  sugerencias  aplican  a  todos  los  analisis  de  varianza  de  este  capftulo: 


1.  Cuando  calcule  sumas  de  cuadrados,  asegurese  de  llevar  al  menos  seis  cifras 
significativas  antes  de  hacer  restas. 

2.  Recuerde,  las  sumas  de  cuadrados  nunca  pueden  ser  negativas.  Si  obtiene  una 
suma  de  cuadrados  negativa,  ha  cometido  un  error  aritmetico. 

3.  Siempre  verifique  su  analisis  de  tabla  de  varianza  para  comprobar  que  los  grados 
de  libertad  ascienden  al  total  de  grados  de  libertad  (n  —  1 )  y  que  las  sumas  de 
cuadrados  ascienden  al  Total  SS. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

11.1  Suponga  que  se  desea  comparar  las  medias 
de  seis  poblaciones  basadas  en  muestras  aleatorias 
independientes,  cada  una  de  las  cuales  contiene  10 
observaciones.  Inserte,  en  una  tabla  ANOVA,  las  fuentes 
de  variacion  y  sus  respectivos  grados  de  libertad. 

11.2  Los  valores  de  SS  Total  y  SSE  para  el  experimento 
del  ejercicio  11.1  son  SS  Total  =  21.4  y  SSE  =  16.2. 

a.  Complete  la  tabla  ANOVA  para  el  ejercicio  ILL 

b.  ('Cuantos  grados  de  libertad  estan  asociados  con  la 
estadfstica  F  para  probar  H0  :  p,  =  p2  =  ■  ■  ■  =  /x6? 

c.  De  la  region  de  rechazo  para  la  prueba  del  inciso  b) 
para  a  =  .05. 

d.  (',Los  datos  dan  suficiente  evidencia  para  indicar 
diferencias  entre  las  medias  poblacionales? 

e.  Estime  el  valor  p  para  la  prueba.  <,Este  valor  confirma 
sus  conclusiones  del  inciso  d)? 

1 1 .3  Las  medias  muestrales  correspondientes  a  las 
poblaciones  1  y  2  del  ejercicio  11.1  sonij  =  3.07  y 
x2  =  2.52. 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  p2. 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  (p,  —  p2). 

1 1 .4  Supongamos  que  se  desea  comparar  las  medias 

de  cuatro  poblaciones  basadas  en  muestras  aleatorias  b. 

independientes,  cada  una  de  las  cuales  contiene  seis  c. 

observaciones.  Inserte,  en  una  tabla  ANOVA,  las  fuentes  ^ 
de  variacion  y  sus  respectivos  grados  de  libertad. 

11.5  Los  valores  de  SS  Total  y  SST  para  el  experimento 

del  ejercicio  1 1.4  son  SS  Total  =  473.2  y  SST  =  339.8.  f. 
a.  Complete  la  tabla  ANOVA  para  el  ejercicio  1 1.4. 


b.  (■.Cuantos  grados  de  libertad  estan  asociados  con  la 
estadfstica  F  para  probar  H0  :  p,  =  p2  =  p2  =  p{! 

c.  De  la  region  de  rechazo  para  la  prueba  del  inciso  b) 
para  a  =  .05. 

d.  (:,Los  datos  dan  suficiente  evidencia  para  indicar 
diferencias  entre  las  medias  poblacionales? 

e.  Aproxime  el  valor  p  para  la  prueba.  (:,Esto  confirma 
sus  conclusiones  del  inciso  d)? 

1 1 .6  Las  medias  muestrales  correspondientes  a  las 
poblaciones  1  y  2  del  ejercicio  1 1.4  son  x,  =  88.0  yx2  = 
83.9. 

a.  Encuentre  un  intervalo  de  confianza  de  90%  para  pt. 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  (/x  —  p2). 

datos  11.7  Estos  datos  son  observaciones  recolectadas 
usando  un  diseno  completamente  aleatorizado: 

Muestra  1  Muestra2  Muestra3 

4  2 

3  0 

5  2 

2  1 

5 

Calcule  CM  y  SS  Total. 

Calcule  SST  y  MST. 

Calcule  SSE  y  MSE. 

Construya  una  tabla  ANOVA  para  los  datos. 

Exprese  la  hipotesis  nula  y  alternativa  para  un  analisis 
de  prueba  F  de  varianza. 

Use  el  metodo  del  valor  p  para  determinar  si  hay  una 
diferencia  en  las  tres  medias  poblacionales. 
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1 1 .8  Consulte  el  ejercicio  11.7  y  el  conjunto  de  datos 
EX  1 107.  (;Los  datos  dan  suficiente  evidencia  para  indicar 
una  diferencia  entre  /x,  y  /x,?  Pruebe  usando  la  prueba  t 
de  la  section  10.4  con  a  =  .05. 

1 1 .9  Consulte  el  ejercicio  11.7  y  el  conjunto  de  datos 
EX1107. 

a.  Encuentre  un  intervalo  de  confianza  de  90%  para  p,. 

b.  Encuentre  un  intervalo  de  confianza  de  90%  para  la 
diferencia  (pi  —  /x,)- 

APLICACIONES 

11.10  Reducir  hostilidad  Unpsicologo 
clinico  deseaba  comparar  tres  metodos  para 
reducir  niveles  de  hostilidad  en  estudiantes 
universitarios,  con  el  uso  de  cierto  examen  psicologico 
(HLT).  Se  tomaron  las  calificaciones  altas  de  este 
examen  como  indicio  de  gran  hostilidad.  Once 
estudiantes  que  obtuvieron  calificaciones  altas  y  casi 
iguales  se  emplearon  en  el  experimento.  Cinco  fueron 
seleccionados  al  azar  de  entre  los  1 1  casos  problema  y 
tratados  con  el  metodo  A,  tres  fueron  tornados  al  azar  de 
los  seis  estudiantes  restantes  y  tratados  con  el  metodo  B 
y  los  otros  tres  estudiantes  fueron  tratados  con  el  metodo 
C.  Todos  los  tratamientos  continuaron  durante  todo  un 
semestre,  cuando  el  examen  HLT  se  aplico  de  nuevo.  Los 
resultados  se  muestran  en  la  tabla. 

Metodo  Calificaciones  en  el  examen  HLT 


A 

73 

83 

76 

B 

54 

74 

71 

C 

79 

95 

87 

a.  Realice  un  analisis  de  varianza  para  este  experimento. 

b.  ^Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  respuesta  media  de  estudiantes  a  los  tres 
metodos  despues  del  tratamiento? 

11.11  Hostilidad,  continua  Consulte  el  ejercicio 
11.10.  Con  pA  y  /xB,  respectivamente,  denote  las 
calificaciones  medias  al  final  del  semestre  para  las 
poblaciones  de  estudiantes  extremadamente  hostiles  que 
fueron  tratados  en  todo  ese  semestre  por  el  metodo  A  y  el 
metodo  B. 

a.  Encuentre  un  intervalo  de  confianza  de  95%  para  /x,A. 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  pB. 

c.  Encuentre  un  intervalo  de  confianza  de  95%  para 
(M a  -  Mb). 

d.  ACs  correcto  decir  que  los  intervalos  de  confianza 
hallados  en  los  incisos  a),  b)  y  c)  son  conjuntamente 
validos? 

(t^DATOs  11.12  Ensamble  de  equipo 

electronico  Se  realizo  un  experimento 


para  comparar  la  efectividad  de  tres  programas  de 
capacitacion,  A,  B  y  C,  para  capacitar  ensambladores 
de  una  pieza  de  equipo  electronico.  Quince  empleados 
se  asignaron  al  azar,  cinco  en  cada  uno,  a  los  tres 
programas.  Despues  de  terminar  los  cursos,  a  cada 
persona  se  le  pidio  ensamblar  cuatro  piezas  de  equipo 
y  se  registro  el  promedio  de  tiempo  necesario  para 
completar  el  ensamble.  Varios  de  los  empleados 
renunciaron  durante  el  curso  del  programa;  el  resto 
fueron  evaluados,  produciendo  los  datos  que  se  ven  en 
la  tabla  siguiente.  Use  la  salida  impresa  MINITAB  para 
contestar  las  preguntas. 

Programa  de  capacitacion  Tiempo  promedio  de  ensamble  (min) 


A 

59 

64 

57 

62 

B 

52 

58 

54 

C 

58 

65 

71 

63  64 

a.  ^Los  datos  dan  suficiente  evidencia  para  indicar 
una  diferencia  en  tiempos  medios  de  ensamble  para 
personal  capacitado  por  los  tres  programas?  De  el 
valor  p  para  el  examen  e  interprete  su  valor. 

b.  Encuentre  un  intervalo  de  confianza  de  99%  para 
la  diferencia  en  tiempos  medios  de  ensamble  para 
personas  capacitadas  en  los  programas  A  y  B. 

c.  Encuentre  un  intervalo  de  confianza  de  99%  para 
los  tiempos  medios  de  ensamble  para  personas 
capacitadas  en  el  programa  A. 

d.  (:,Piensa  usted  que  los  datos  satisfacen 
(aproximadamente)  la  suposicion  de  que  han  sido 
seleccionados  de  poblaciones  normales?  0 Por  que? 

Salida  impresa  MINITAB  para  el  ejercicio  11.12 


ANOVA  en  una  direction:  tiempo  contra  programa 


Source 

Program 

Error 

Total 


DF  SS 

2  170.5 

9  134.5 

11  304.9 

R-Sq  =  55.90% 


N  Mean 

4  60.500 

3  54.667 

5  64.200 


MS  F  P 

85.2  5.70  0.025 

14 . 9 

R-Sq(adj)  =  46.10% 

Individual  95%  CIs  For  Mean 
Based  on  Pooled  StDev 

StDev  -+ - + - + - + - 

3.3.09  ( - * - ) 

3.055  ( - * - ) 

4.658  ( - * - ) 


Pooled  StDev  =  3.865 


50.0  55.0  60.0  65.0 


((J^datos  11.13  Sitios  pantanosos  Se  realizo  un 

estudio  ecologico  para  comparar  los  porcentajes 
de  crecimiento  de  vegetation  en  cuatro  lugares 
pantanosos  sin  urbanizar,  asf  como  para  determinar 
la  causa  de  cualesquiera  diferencias  que  pudieran 
observarse.  Parte  del  estudio  comprendfa  medir  la 
longitud  de  las  hojas  de  una  especie  particular  de  plantas 
en  una  fecha  preseleccionada  en  mayo.  Seis  plantas  se 
seleccionaron  al  azar  en  cada  uno  de  los  cuatro  lugares 
para  usarlas  en  la  comparacion.  Los  datos  de  la  tabla  son 
la  longitud  media  de  hoja  por  planta  (en  centfmetros)  para 
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una  muestra  aleatoria  de  10  hojas  por  planta.  Tambien 
se  proporciona  el  analisis  MINITAB  de  varianza  de  salida 
impresa  de  computadora  para  estos  datos. 


Lugar  Longitud  media  de  hoja 


1 

5.7 

B.3 

B.1 

B.O 

5.8 

B.2 

2 

B.2 

5.3 

5.7 

B.O 

5.2 

5.5 

3 

5.4 

5.0 

B.O 

5.6 

4.9 

5.2 

4 

3.7 

3.2 

3.9 

4.0 

3.5 

3.6 

Salida  impresa  MINITABpara  el  ejercicio  11.13 


seleccionaron  arriba  de  una  planta  industrial,  una  cerca 
de  la  orilla  y  la  otra  a  mi  tad  del  rfo;  el  lugar  3  estaba 
adyacente  a  la  descarga  del  agua  industrial  para  la  planta; 
y  el  lugar  4  estaba  ligeramente  aguas  abajo  a  mitad  del 
rfo.  Cinco  especlmenes  de  agua  se  seleccionaron  al 
azar  en  cada  lugar,  pero  un  especimen,  correspondiente 
al  lugar  4,  se  perdio  en  el  laboratorio.  Los  datos  y 
un  analisis  de  varianza  con  MINITAB  de  computadora 
de  salida  impresa  se  dan  a  continuacion  (a  mayor 
contaminacion,  lecturas  mas  bajas  de  oxlgeno  disuelto). 


ANOVA  en  una  direccion:  longitud  contra  lugar 


Source  DF  SS 

Location  3  19.740 

Error  20  2.293 

Total  23  22.033 

S  =  0.3386  R-Sq  =  89.59% 


MS  F  P 

6.580  57.38  0.000 
0.115 

R-Sq(adj)  =  88.03% 

Individual  95%  CIs  For  Mean 
Based  on  Pooled  StDev 


N  Mean 
6  6.0167 
6  5.6500 
6  5.3500 
6  3.6500 


StDev 

0.2317 

0.3937 

0.4087 

0.2881 


(--*  —  ) 


Pooled  StDev  =  0.3386 


4.00  4.80  5.60  6.40 


a.  Usted  recordara  que  los  procedimientos  de  prueba  y 
estimacion,  para  un  analisis  de  varianza,  requieren  que 
las  observaciones  sean  seleccionadas  de  poblaciones 
normalmente  distribuidas  (al  menos  aproximadas). 

I  Por  que  podria  sentir  confianza  razonable  de  que  sus 
datos  satisfacen  esta  suposicion? 

b.  pLos  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  longitud  media  de  hojas  entre  los  cuatro 
lugares?  6Cual  es  el  valor  p  para  la  prueba? 

c.  Suponga,  antes  de  ver  los  datos,  que  usted  decidio 
comparar  las  longitudes  medias  de  hojas  de  los  lugares 
1  y  4.  Pruebe  la  hipotesis  nula  p,  =  pA  contra  la 
alternativa  p,  *  p4. 

d.  Consulte  el  inciso  c).  Construya  un  intervalo  de 
confianza  de  99%  para  (px  —  /x4). 

e.  En  lugar  de  usar  un  analisis  de  varianza  de  la  prueba 
F,  parecerfa  mas  sencillo  examinar  los  datos  de  uno, 
seleccionar  los  dos  lugares  que  tengan  las  longitudes 
medias  muestrales  mas  cortas  y  mas  largas,  y  a 
continuacion  comparar  estas  dos  medias  usando  la 
prueba  t  de  Student.  Si  hay  evidencia  para  indicar  una 
diferencia  en  estas  medias,  hay  claramente  evidencia 
de  una  diferencia  entre  las  cuatro.  (Si  se  usara  esta 
logica,  no  habrfa  necesidad  del  analisis  de  varianza  de 
la  prueba  F.)  Explique  por  que  este  procedimiento  es 
invalido. 

(^)datos  1 1.14  Contenido  de  02  disuelto  Se 

tomaron  muestras  de  agua  de  un  rfo  en  cuatro 
lugares  diferentes  para  determinar  si  la  cantidad  de 
oxlgeno  disuelto,  una  medida  de  la  contaminacion  del 
agua,  variaba  de  un  lugar  a  otro.  Los  lugares  1  y  2  se 


Lugar  Contenido  medio  de  oxigeno  disuelto 


1 

5.9 

B.1 

6.3 

6.1 

6.0 

2 

6.3 

B.6 

6.4 

6.4 

6.5 

3 

oo 

•tf- 

4.3 

5.0 

4.7 

5.1 

4 

6.0 

B.2 

6.1 

5.8 

Salida  impresa  de  MINITABpara  el  ejercicio  11.14 


Anova  en  una  via:  oxlgeno  contra  lugar 


Source  DF  SS  MS  F  P 

Location  3  7.8361  2.6120  63.66  0.000 

Error  15  0.6155  0.0410 

Total  18  8.4516 

S  =  0.2026  R-Sq  =  92.72%  R-Sq(adj)  =  91.26% 

Individual  95%  CIs  For  Mean 
Based  on  Pooled  StDev 


N  Mean 
5  6.0800 
5  6.4400 
5  4.7800 
4  6.0250 


StDev  - + - 

0.1483 

0.1140 

0.3114  ( - *--) 

0.1708 


Pooled  StDev  =  0.2026 


4.80  5.40  6.00  6.60 


a.  (:,Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  el  contenido  medio  de  oxlgeno  disuelto 
para  los  cuatro  lugares? 

b.  Compare  el  contenido  medio  de  oxlgeno  disuelto 

a  mitad  del  rfo  arriba  de  la  planta,  con  el  contenido 
medio  adyacente  a  la  planta  (lugar  2  contra  lugar  3). 
Use  un  intervalo  de  confianza  de  95%. 

datos  11.15  Calcio  El  contenido  de  calcio  de 

una  sustancia  mineral  pulverizada  fue  analizada 
cinco  veces  por  cada  uno  de  tres  metodos, 
con  desviaciones  estandar  similares: 


Metodo  Porcentaje  de  calcio 


1 

.0279 

.0276 

.0270 

.0275 

.0281 

2 

.0268 

.0274 

.0267 

.0263 

.0267 

3 

.0280 

.0279 

.0282 

.0278 

.0283 

Use  una  prueba  adecuada  para  comparar  los  tres  metodos 
de  medicion.  Comente  sobre  la  validez  de  cualesquiera 
suposiciones  que  sea  necesario  hacer. 

datos  11.16  Atun  En  el  ejercicio  10.6,  informamos 
de  los  precios  promedio  estimados  para  una  lata 
de  6  onzas  o  una  bolsa  de  7.06  onzas  de  atun,  con  base 
en  precios  pagados  a  nivel  nacional  por  una  variedad  de 
marcas  diferentes  de  atun.1 
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Atun  claro  Atun  bianco  Atun  bianco  Atun  claro 
en  agua  en  aceite  en  agua  en  aceite 


.99 

.53 

1.27 

1.49 

2.56 

.62 

1.92 

1.41 

1.22 

1.29 

1.92 

.66 

1.23 

1.12 

1.19 

1.27 

1.30 

.62 

.85 

.63 

1.22 

1.35 

1.79 

.65 

.65 

.67 

1.29 

1.23 

.60 

.69 

.60 

1.00 

.67 

.60 

.66 

1.27 

1.28 

Fuente:  De  "Pricing  of  Tuna"  Copyright  2001  por  Consumers  Union  of  U.S.,  Inc.,  Yonkers, 

NY  10703-1057,  organizacion  sin  fines  de  lucro.  Reimpreso  con  permiso  de  la  edicion  de  ju- 
nio  de  2001  de  Consumer  Reports®  solo  para  fines  educativos.  No  se  permite  uso  comercial 
ni  reproduce™.  www.ConsumerReports.org®. 

a.  Use  un  analisis  de  varianza  para  un  diseno 
completamente  aleatorizado,  para  determinar  si 
hay  diferencias  significativas  en  los  precios  de 
atun  empacados  en  estas  cuatro  formas.  y,Se  puede 
rechazar  la  hipotesis  de  que  no  hay  diferencia  en  el 
precio  promedio  para  estos  empaques  al  nivel  de 
significancia  de  a  =  .05?  (',Y  al  nivel  de  significancia 
de  a  =  .01? 

b.  Encuentre  una  estimacion  de  intervalo  de  confianza  de 
95%  de  la  diferencia  en  precio  entre  atun  claro  en  agua 
y  atun  claro  en  aceite. Parece  haber  una  diferencia 
significativa  en  el  precio  de  estas  dos  clases  de  atun 
empacado? 

c.  Encuentre  una  estimacion  de  intervalo  de  confianza 
de  95%  de  la  diferencia  en  precio  entre  atun  bianco 
en  agua  y  atun  bianco  en  aceite.  ^Parece  haber  una 
diferencia  significativa  en  el  precio  de  estas  dos  clases 
de  atun  empacado? 

d.  ^Que  otros  intervalos  de  confianza  podrfan  ser 
de  interes  para  el  investigador  que  realizara  el 
experimento? 

(^)datos  11.17  El  costo  de  la  madera  Un 

constructor  de  viviendas  a  nivel  nacional 
desea  comparar  los  precios  por  1000  pies  de  madera  de 
armazones  de  abeto  Douglas  de  calidad  estandar  o  mejor. 
Al  azar  selecciona  cinco  proveedores  en  cada  uno  de  los 


cuatro  estados  donde  el  constructor  esta  planeando  iniciar 
la  construccion.  Los  precios  se  dan  en  la  tabla  siguiente. 


Estado 


1 

2 

3 

4 

$241 

$216 

$230 

$245 

235 

220 

225 

250 

238 

205 

235 

238 

247 

213 

228 

255 

250 

220 

240 

255 

a.  (,Que  tipo  de  diseno  experimental  se  ha  empleado? 

b.  Construya  la  tabla  del  analisis  de  varianza  para  estos 
datos. 

c.  y,Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  precio  promedio  por  1000  pies  de  madera  de  abeto 
Douglas  difiere  entre  los  cuatro  estados?  Pruebe 
usando  a  =  .05. 

^)datos  11.18  ^Bueno  para  las  matematicas? 

Veinte  alumnos  de  tercer  grado  se  separaron 
al  azar  en  cuatro  grupos  iguales  y  a  cada  grupo  se  le 
impartieron  conceptos  matematicos  usando  un  metodo 
diferente  de  ensenanza,  midiendose  el  progreso  mediante 
un  examen  unitario  al  final  del  periodo  de  ensenanza. 

Las  calificaciones  se  muestran  a  continuation  (un  nino 
del  grupo  3  estuvo  ausente  el  dfa  en  que  se  aplico  el 
examen). 


Grupo 


1 

2 

3 

4 

112 

111 

140 

101 

92 

129 

121 

116 

124 

102 

130 

105 

89 

136 

106 

126 

97 

99 

119 

a.  (,Que  tipo  de  diseno  se  ha  empleado  en  este 
experimento? 

b.  Construya  una  tabla  ANOVA  para  el  experimento. 

c.  (',Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  el  promedio  de  calificaciones  para 
los  cuatro  metodos  de  ensenanza?  Pruebe  usando 

a  =  .05. 


CLASIFICACION  DE  MEDIAS 
POBLACIONALES 

Numerosos  experimentos  son  exploratorios  por  naturaleza.  No  hay  nociones  preconce- 
bidas  de  los  resultados  y  no  se  ha  decidido  (antes  de  realizar  el  experimento)  de  hacer 
comparaciones  especfficas  de  tratamiento.  En  lugar  de  esto,  se  desea  clasificar  las  medias 
de  tratamiento,  determinar  cuales  medias  difieren  e  identificar  conjuntos  de  medias  para 
las  cuales  no  hay  evidencia  de  diferencia. 
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Una  opcion  podrfa  ser  ordenar  las  medias  muestrales  de  menor  a  mayor  y  a  conti- 
nuacion  efectuar  pruebas  t  para  medias  adyacentes  en  el  ordenamiento.  Si  dos  medias 
difieren  en  mas  de 


ta/2 


se  concluye  que  el  par  de  medias  poblacionales  difiere.  El  problema  con  este  procedi- 
miento  es  que  la  probabilidad  de  hacer  un  error  tipo  I,  es  decir,  concluir  que  dos  me¬ 
dias  difieren  cuando  en  realidad  son  iguales,  es  a  para  cada  prueba.  Si  se  compara  un 
gran  mimero  de  pares  de  medias,  la  probabilidad  de  detectar  al  menos  una  diferencia  en 
medias,  cuando  en  realidad  ninguna  existe,  es  bastante  grande. 

Una  forma  sencilla  de  evitar  el  alto  riesgo  de  declarer  diferencias  cuando  no  existen 
es  usar  el  rango  de  Student,  que  es  la  diferencia  entre  la  mas  pequena  y  la  mas  grande 
en  un  conjunto  de  k  medias  muestrales,  como  la  medida  para  determinar  si  hay  una 
diferencia  en  un  par  de  medias  poblacionales.  Este  metodo,  a  veces  metodo  de  Tukey 
para  comparaciones  apareadas,  hace  que  sea  igual  a  a  la  probabilidad  de  declarar 
que  existe  una  diferencia  entre  al  menos  un  par  en  un  conjunto  de  k  medias  de  trata- 
miento,  cuando  no  existe  diferencia. 

El  metodo  de  Tukey  para  hacer  comparaciones  apareadas  esta  basado  en  el  analisis 
usual  de  suposiciones  de  varianza.  Ademas,  supone  que  las  medias  muestrales  son 
independientes  y  estan  basadas  en  muestras  de  igual  tamano.  La  medida  que  deter- 
mina  si  existe  una  diferencia  entre  un  par  de  medias  de  tratamiento  es  la  cantidad  co 
(omega  minuscula),  que  se  presenta  a  continuacion. 


MEDIDA  PARA  HACER  COMPARACIONES 
APAREADAS 


w  =  qfk, 


donde 

k 

2 

s 

df 

n, 

qa(k,df) 


Numero  de  tratamientos 

MSE  =  Estimador  de  la  varianza  comun  a2  y  s  =  \  s 
Numero  de  grados  de  libertad  para  s2 

Tamano  muestral  comun,  es  decir,  el  numero  de  observaciones  en  cada 
una  de  las  k  medias  de  tratamiento 

Valor tabulado  de  las  tablas  1  la)  y  lib)  del  apendice  I,  para  a  =  .05  y 
.01,  respectivamente  y  para  varias  combinaciones  de  ky  df 


Regia:  Dos  medias  poblacionales  se  juzga  que  difieren  si  las  medias  muestrales 
correspondientes  difieren  en  co  o  mas. 


Las  tablas  11a)  y  lib)  del  apendice  I  contienen  los  valores  de  qjjc,  df)  para  a  =  .05 
y  .01,  respectivamente.  Para  ilustrar  el  uso  de  las  tablas,  consulte  la  parte  de  la  tabla  11a) 
reproducida  en  la  tabla  1 1 .2.  Suponga  que  se  desea  hacer  comparaciones  por  pares  de 
k  =  5  medias  con  a  =  .05  para  un  analisis  de  varianza,  donde  ,v2  posee  9  df.  El  valor  tabu¬ 
lado  para  k  =  5,df=9ya  =  .05,  sombreados  en  la  tabla  1 1.2,  es  q0 5(5,  9)  =  4.76. 
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TABLA  11.2 


Reproduccion  parcial  de  la  tabla  11a)  del  apendice  I;  puntos 
de  5%  superiores 


df 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

1 

17.97 

26.98 

32.82 

37.08 

40.41 

43.12 

45.40 

47.36 

49.07 

50.59 

51.96 

2 

6.08 

8.33 

9.80 

10.88 

11.74 

12.44 

13.03 

13.54 

13.99 

14.39 

14.75 

3 

4.50 

5.91 

6.82 

7.50 

8.04 

8.48 

8.85 

9.18 

9.46 

9.72 

9.95 

4 

3.93 

5.04 

5.76 

6.29 

6.71 

7.05 

7.35 

7.60 

7.83 

8.03 

8.21 

5 

3.64 

4.60 

5.22 

5.67 

6.03 

6.33 

6.58 

6.80 

6.99 

7.17 

7.32 

B 

3.46 

4.34 

4.90 

5.30 

5.63 

5.90 

6.12 

6.32 

6.49 

6.65 

6.79 

7 

3.34 

4.16 

4.68 

5.06 

5.36 

5.61 

5.82 

6.00 

6.16 

6.30 

6.43 

8 

3.26 

4.04 

4.53 

4.89 

5.17 

5.40 

5.60 

5.77 

5.92 

6.05 

6.18 

9 

3.20 

3.95 

4.41 

4.76 

5.02 

5.24 

5.43 

5.59 

5.74 

5.87 

5.98 

10 

3.15 

3.88 

4.33 

4.65 

4.91 

5.12 

5.30 

5.46 

5.60 

5.72 

5.83 

11 

3.11 

3.82 

4.26 

4.57 

4.82 

5.03 

5.20 

5.35 

5.49 

5.61 

5.71 

12 

3.08 

3.77 

4.20 

4.51 

4.75 

4.95 

5.12 

5.27 

5.39 

5.51 

5.61 

E  J  E  M  P  L  O 


11.7 


Consulte  el  ejemplo  11.4,  en  el  que  se  compare  el  promedio  de  intervalos  de  atencion 
para  estudiantes  a  los  que  se  dieron  diferentes  tratamientos  de  “comida”  en  la  manana: 
no  desayuno,  un  desayuno  ligero  o  un  desayuno  completo.  La  prueba  F  de  ANOVA 
del  ejemplo  1 1.5  indico  una  diferencia  significativa  en  las  medias  poblacionales.  Use  el 
metodo  de  Tukey  para  comparaciones  apareadas,  para  determinar  cual  de  las  tres  medias 
poblacionales  difiere  de  las  otras. 


Para  este  ejemplo,  hay  k  =  medias  de  tratamiento,  con  s  =  vMSE  = 
2.436.  El  metodo  de  Tukey  se  puede  usar,  con  cada  una  de  las  tres  muestras  conteniendo 
n,  =  5  mediciones  y  (n  —  k)  =  1 2  grados  de  libertad.  Consulte  la  tabla  1 1  en  el  apendice 
I  para  hallar  qm(k,  df)  =  q, 05(3,  12)  =  3.77  y  calcule  la  “regia”  como 


co  =  <7.05(3,  12)(7^=)  =  3.77 


2.436 

V5 


=  4.11 


Las  tres  medias  de  tratamiento  estan  dispuestas  en  orden  de  la  mas  pequena,  9.4,  a  la 
maxima,  14.0,  en  la  figura  11.8.  El  siguiente  paso  es  comprobar  la  diferencia  entre  cada 
par  de  medias.  La  unica  diferencia  que  excede  de  co  =  4.11  es  la  diferencia  entre  no 
desayuno  y  un  desayuno  ligero.  Estos  dos  tratamientos  se  declaran  as!  significativamente 
diferentes.  No  se  puede  declarar  una  diferencia  entre  los  otros  dos  pares  de  tratamientos. 
Para  indicar  este  hecho  visualmente,  la  figura  1 1.8  muestra  una  llnea  bajo  los  pares  de 
medias  que  no  son  significativamente  diferentes. 


FIGURA  11.8 


Medias  dasificadas  para  el 
ejemplo  11.7 


Ninguno  Completo  Ligero 

9.4  13.0  14.0 


Estos  resultados  pueden  parecer  confusos,  pero  por  lo  general  ayuda  considerar  la 
clasificacion  de  las  medias  e  interpretar  diferencias  no  significativas  como  nuestra  inca- 
pacidad  de  clasificar  de  manera  distintiva  las  medias  subrayadas  por  la  misma  lfnea.  Para 
este  ejemplo,  el  desayuno  ligero  definitivamente  clasifico  mas  alto  que  no  desayuno, 
pero  el  desayuno  completo  no  pudo  ser  clasificado  mas  alto  que  el  no  desayuno,  o  mas 
abajo  que  el  desayuno  ligero.  La  probabilidad  de  que  cometimos  al  menos  un  error  entre 
las  tres  comparaciones  es  al  menos  a  =  .05. 
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Si  cero  no  esta  en  el 
intervalo,  hay  evidencia 
de  una  diferencia  entre 
los  dos  metodos. 


Casi  todos  los  programas  de  computadora  dan  una  opcion  para  realizar  comparacio- 
nes  apareadas,  incluyendo  el  metodo  de  Tukey.  La  salida  impresa  del  MINITAB  de  la 
figura  1 1.9  muestra  su  forma  de  la  prueba  de  Tukey,  que  difiere  ligeramente  del  metodo 
que  hemos  presentado.  Los  tres  intervalos  que  se  ven  en  la  salida  impresa  marcada 
“Inferior”  y  “Superior”  representan  la  diferencia  en  las  dos  medias  muestrales  mas  o 
menos  la  regia  co.  Si  el  intervalo  contiene  el  valor  0,  las  dos  medias  se  juzgan  como  no 
significativamente  diferentes.  Se  puede  ver  que  las  unicas  medias  1  y  2  (no  desayuno 
contra  desayuno  ligero)  muestra  una  diferencia  significativa. 


FIGURA  11.9 

Salida  impresa  MINITAB 
para  el  ejemplo  11.7 


Tukey 's  95%  Simultaneous  Confidence  Intervals 
All  Pairwise  Comparisons  among  Levels  of  Meal 
Individual  confidence  level  =  97.94% 


Meal  =  1  subtracted  from: 


Meal  Lower  Center  Upper  - + - + - + - + - 

2  0.493  4.600  8.707  ( - * - ) 

3  -0.507  3.600  7.707  ( - * - ) 

-3.5  0.0  3.5  7.0 

Meal  =  2  subtracted  from: 

Meal  Lower  Center  Upper  - + - + - + - + - 


3  -5.107  -1.000  3.107  ( - * - ) 


-3.5  0.0  3.5  7.0 


Cuando  usted  estudie  dos  disenos  experimentales  mas  en  las  siguientes  secciones  de 
este  capitulo,  recuerde  que,  una  vez  que  haya  encontrado  que  un  factor  es  significativo, 
debe  usar  el  metodo  de  Tukey  u  otro  metodo  de  comparaciones  apareadas  para  averiguar 
exactamente  donde  estan  las  diferencias. 


EJERCICIOS 


TECNICAS  BASICAS 

11.19  Supongamos  que  usted  desea  usar  el  metodo  de 
Tukey  de  comparaciones  apareadas  para  clasificar  un 
conjunto  de  medias  poblacionales.  Ademas  del  analisis 
de  suposiciones  de  varianza, 7,  que  otra  propiedad  deben 
satisfacer  las  medias  de  tratamiento? 

1 1 .20  Consulte  las  tabla  1  la)  y  1  lb)  del  apendice  I  y 
encuentre  los  valores  de  qa(k,  df)  para  estos  casos: 

a.  a  =  .05,  k  =  5,  df  =  7 


basados  en  muestras  de  cuatro  observaciones  por 
tratamiento.  El  estimador  agrupado  de  cr  es  9.12,  y  las 
medias  muestrales  siguen: 

Xi  =  101.6  x2  =  98.4  *,  =  112.3 

*4  =  92.9  *5  =  104.2  x6  =  113.8 

a.  De  el  valor  de  co  que  usarfa  para  hacer  comparaciones 
por  pares  de  las  medias  de  tratamiento  para  a  =  .05. 

b.  Ordene  las  medias  de  tratamiento  usando 
comparaciones  por  pares. 


b.  a  =  .05,  k  =  3 ,df=  10 

c .  a  =  .01,  k  =  4,  df=  8 

d.  a  =  .01,  k  =  7 ,df=  5 

1 1 .21  Si  el  tamano  muestral  para  cada  tratamiento  es  n, 
y  si  s 2  esta  basada  en  12  df,  encuentre  co  en  estos  casos: 


APLICACIONES 

1 1 .23  Sitios  pantanosos,  otra  vez  Consulte  el 
ejercicio  1 1.13  y  el  conjunto  de  datos  EX1 113.  Ordene  el 
crecimiento  medio  de  hojas  para  los  cuatro  lugares.  Use 
a  =  .01. 


a.  a  =  .05,  k  =  4,  n,  =  5 

b .  a  =  .01,  k  =  6,  n,  =  8 

1 1 .22  Un  diseno  de  muestreo  aleatorio  independiente 
se  utilizo  para  comparar  las  medias  de  seis  tratamientos 


1 1 .24  Calcio  Consulte  el  ejercicio  1 1 . 15  y  el  conjunto 
de  datos  EX1 1 15.  La  opcion  de  comparaciones  pareadas 
en  MINITAB  genero  la  salida  impresa  siguiente.  i Que 
indican  estos  resultados  acerca  de  las  diferencias  en  las 
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medias  poblacionales?  ^Esto  confirma  sus  conclusiones 
del  ejercicio  11.15? 

Salida  impresa  MINITAB  para  el  ejercicio  11.24 


Tukey's  95%  Simultaneous  Confidence  Intervals 
All  Pairwise  Comparisons  among  Levels  of  Method 
Individual  confidence  level  =  97.94% 


Method  = 

1  subtracted 

from: 

Method 

Lower 

Center 

Upper 

2 

-0.0014377  - 

0 . 0008400 

-0 . 0002423 

3 

-0 . 0001777 

0 . 0004200 

0 . 0010177 

Method 

- + - 

- + - 

- + - 

- + 

2 

( - *__ 

3 

( - *_ 

— > 

- + - 

- + - 

- + - 

- + 

-0 . 0010 

0 . 0000 

0 . 0010 

0 .0020 

Method  = 

2  subtracted 

from: 

Method 

Lower 

Center 

Upper 

3 

0 . 0006623 

0 . 0012600 

0 . 0018577 

Method 

- + - 

- + - 

- + - 

- + 

3 

( - * - 

--) 

- + - 

- + - 

- + - 

- + 

-0 . 0010 

0 . 0000 

0 . 0010 

0 .0020 

(g)  datos  11.25  Tolerancia  a  la  glucosa  Los 

medicos  dependen  de  resultados  de  examenes 
de  laboratorio  cuando  manejan  problemas  medicos  como 
diabetes  o  epilepsia.  En  un  examen  de  uniformidad  para 
tolerancia  a  la  glucosa,  a  tres  laboratorios  diferentes  se 
les  enviaron  n,  =  5  muestras  de  sangre  identicas  de  una 
persona  que  habfa  bebido  50  miligramos  (mg)  de  glucosa 
disuelta  en  agua.  Los  resultados  de  laboratorio  (en  mg/dl) 
son  los  siguientes: 


Labi 

Lab  2 

Lab  3 

120.1 

98.3 

103.0 

110.7 

112.1 

108.5 

108.9 

107.7 

101.1 

104.2 

107.9 

110.0 

100.4 

99.2 

105.4 

a.  pLos  datos  indican  una  diferencia  en  el  promedio  de 
lecturas  para  los  tres  laboratorios? 

b.  Use  el  metodo  de  Tukey  para  comparaciones 
apareadas  para  clasificar  las  tres  medias  de 
tratamiento.  Use  a  =  .05. 


1 1 .26  El  costo  de  la  madera,  continua  El 

analisis  de  varianza  de  la  prueba  F  en  el  ejercicio 
11.17  (y  conjunto  de  datos  EX1 1 17)  determino  que, 
efectivamente,  habfa  una  diferencia  en  el  costo  promedio 
de  madera  para  los  cuatro  estados.  La  siguiente 
informacion  del  ejercicio  11.17  se  da  en  la  tabla. 


Medias  muestrales  x,  =  242.2 

MSE  41.25 

x2  =  214.8 

Error  df:  16 

x3  =  231.6 

rij :  5 

x4  =  248.6 

k:  4 

Use  el  metodo  de  Tukey  para  comparaciones  apareadas 
para  determinar  cuales  medias  difieren  significativamente 
respecto  de  las  otras  al  nivel  a  =  .01. 

(^)datos  11.27  Calificaciones  del  GRE  Las 

calificaciones  de  Examen  de  Registro 
de  Graduados  (GRE,  por  sus  siglas  en  ingles),  se 
registraron  para  estudiantes  admitidos  en  tres  programas 
diferentes  para  graduados  en  una  universidad  local. 

Programa  de  graduados 

J _ 2 _ 3_ 

532  670  502 

548  590  607 

619  640  549 

509  710  524 

627  690  542 

a.  t,Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  las  calificaciones  medias  del  GRE,  para 
solicitantes  admitidos  a  los  tres  programas? 

b.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  calificaciones  medias  del  GRE  para  los 
programas  1  y  2. 

c.  Si  encuentra  una  diferencia  significativa  en  las 
calificaciones  del  GRE  para  los  tres  programas,  use 
el  metodo  de  Tukey  para  comparaciones  apareadas 
para  determinar  cuales  medias  difieren 
significativamente  de  las  otras.  Use  a  =  .05. 


DISENO  DE  BLOQUE  ALEATORIZADO:  UNA 
CLASIFICACION  EN  DOS  DIRECCIONES 

El  disefio  completamente  aleatorizado  introducido  en  la  seccion  11.4  es  una  genera¬ 
lization  del  diseno  de  las  dos  muestras  independientes  presentado  en  la  seccion  10.4. 
Esta  pensado  para  usarse  cuando  las  unidades  experimentales  sean  bastante  similares 
u  homogeneas  en  su  conformation  y  cuando  haya  solo  un  factor,  el  tratamiento,  que 
pueda  influir  en  la  respuesta.  Cualquier  otra  variacion  en  la  respuesta  se  debe  a  variacion 
aleatoria  o  a  error  experimental.  A  veces  es  claro  para  el  investigador  que  las  unidades 
experimentales  no  sean  homogeneas.  Personas  o  animales  con  caracter  experimental, 
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b  =  bloques 
k  =  tratamientos 


n  =  bk 


campos  agricolas,  dfas  de  la  semana  y  otras  unidades  experimentales  a  veces  agregan  su 
propia  variabilidad  a  la  respuesta.  Aun  cuando  el  investigador  no  este  realmente  intere- 
sado  en  esta  fuente  de  variacion,  sino  que  mas  bien  en  algiin  tratamiento  que  escoja  apli- 
car,  puede  aumentar  la  information  al  aislar  esta  fuente  de  variacion  usando  el  diseno 
de  bloque  aleatorizado,  que  es  una  extension  directa  de  los  pares  acoplados  o  diseno  de 
diferencia  apareada  de  la  seccion  10.5. 

En  un  diseno  de  bloque  aleatorizado,  el  experimentador  esta  interesado  en  comparar 
k  medias  de  tratamiento.  El  diseno  utiliza  bloques  de  k  unidades  experimentales  que  son 
claramente  similares,  u  homogeneos,  con  una  unidad  dentro  de  cada  bloque  asignada 
al  azar  a  cada  tratamiento.  Si  el  diseno  de  bloque  aleatorizado  contiene  k  tratamientos 
dentro  de  cada  uno  de  los  b  bloques,  entonces  el  mimero  total  de  observaciones  en  el 
experimento  es  n  =  bk. 

Un  supervisor  de  produccion  desea  comparar  los  tiempos  medios  para  que  operadores 
de  linea  de  produccion  ensamblen  un  articulo  usando  uno  de  tres  metodos:  A,  B  o  C. 
Esperando  variacion  en  tiempos  de  ensamble  de  un  operador  a  otro,  el  supervisor  emplea 
un  diseno  de  bloque  aleatorizado  para  comparar  los  tres  metodos.  Cinco  operadores  de 
linea  de  produccion  se  seleccionan  para  servir  como  bloques  y  a  cada  uno  se  le  asigna 
ensamblar  el  articulo  tres  veces,  una  vez  por  cada  uno  de  los  tres  metodos.  Como  la 
secuencia  en  la  que  el  operador  usa  los  tres  metodos  puede  ser  importante  (fatiga  o  mayor 
destreza  pueden  ser  factores  que  afecten  la  respuesta),  cada  operador  debe  ser  asignado 
a  una  secuencia  aleatoria  de  los  tres  metodos.  Por  ejemplo,  el  operador  1  podria  ser 
asignado  a  efectuar  primero  el  metodo  C,  seguido  por  A  y  B.  El  operador  2  podria  reali- 
zar  primero  el  metodo  A,  seguido  del  C  y  B. 

Para  comparar  cuatro  metodos  diferentes  de  ensenanza,  un  grupo  de  estudiantes 
podria  ser  dividido  en  bloques  de  tamano  4,  de  modo  que  los  grupos  se  encuentren  casi 
acoplados  segun  su  rendimiento  academico.  Para  comparar  los  costos  promedio  de  tres 
companias  de  telefonia  celular  diferentes,  los  costos  podrfan  compararse  en  cada  uno 
de  tres  niveles  de  uso:  bajo,  medio  y  alto.  Para  comparar  el  promedio  de  produccion  de 
tres  especies  de  arboles  frutales,  cuando  se  espera  una  variacion  en  produccion  debido  al 
campo  en  el  que  se  planten  los  arboles,  una  investigadora  usa  cinco  campos.  Ella  divi¬ 
de  cada  campo  en  tres  lotes  en  los  que  estan  plantadas  las  tres  especies  de  arboles  fru¬ 
tales. 

El  acoplamiento  o  bloqueo  puede  tener  lugar  en  muchas  formas  diferentes.  Las  com- 
paraciones  de  tratamientos  se  hacen  a  veces  dentro  de  bloques  de  tiempo,  dentro  de  blo¬ 
ques  de  personas  o  dentro  de  ambientes  externos  similares.  El  proposito  de  bloquear  es 
remover  o  aislar  la  variabilidad  de  un  bloque  a  otro  que  pudiera  de  otro  modo  ocultar  el 
efecto  de  los  tratamientos.  Usted  encontrara  mas  ejemplos  del  uso  del  diseno  de  bloque 
aleatorizado  en  los  ejercicios  al  final  de  la  seccion  siguiente. 


EL  ANALISIS  DE  VARIANZA  PARA 
UN  DISENO  DE  BLOQUE  ALEATORIZADO 

El  diseno  de  bloque  aleatorizado  identifica  dos  factores:  tratamientos  y  bloques,  los 
cuales  afectan  la  respuesta. 

Division  de  la  variacion  total 
en  el  experimento 

Sea  Xy  la  respuesta  cuando  el  i-esimo  tratamiento  (i  =  1 ,  2,  . . . ,  k)  se  aplica  en  el  /-esimo 
bloque  (j  =  1.2,...,/?).  La  variacion  total  en  las  n  =  bk  observaciones  es 

SS  Total  =  X(Xij  -  xf  =  24  “  ~TT~ 
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Esto  se  divide  en  tres  (en  lugar  de  dos)  partes  de  modo  que 

SS  Total  =  SSB  +  SST  +  SSE 
donde 

•  SSB  (suma  de  cuadrados  para  bloques)  mide  la  variation  entre  las  medias  de 
bloque. 

•  SST  (suma  de  cuadrados  para  tratamientos)  mide  la  variation  entre  las  medias 
de  tratamiento. 

•  SSE  (suma  de  cuadrados  para  error)  mide  la  variation  de  las  diferencias  entre  las 
observaciones  de  tratamiento  dentro  de  bloques,  que  mide  el  error  experimental. 

Las  formulas  de  calculo  para  las  cuatro  sumas  de  cuadrados  son  semejantes  en  forma 
a  las  empleadas  para  el  diseno  completamente  aleatorizado  de  la  section  11.5.  Aun 
cuando  se  puede  simplificar  el  trabajo  con  el  uso  de  un  programa  computarizado  para 
calcular  estas  sumas  de  cuadrados,  las  formulas  se  dan  a  continuation. 


cAlculo  de  las  sumas  de  cuadrados 

PARA  UN  DISENO  DE  BLOQUE  ALEATORIZADO, 
k  TRATAMIENTOS  EN  b  BLOQUES 


SS  Total  =  SST  + 
SSB  +  SSE 


donde 

G  =  %Xij  =  Total  de  todas  las  n  =  bk  observaciones 
SS  Total  =  Xx\  -  CM 

=  (Suma  de  cuadrados  de  todos  los  valores  x)  —  CM 
SST  =  Xj~  ~  CM 

D  2 

SSB  =  X~f  -  CM 

SSE  =  SS  Total  -  SST  -  SSB 


con 

Tj  =  Total  de  todas  las  observaciones  que  reciben  tratamiento  i,  i  =  1 . 2,  k 
Bj  =  Total  de  todas  las  observaciones  en  bloque  j,j  =  1,  2,  ...,  b 

Cada  una  de  las  tres  fuentes  de  variacion,  cuando  estan  divididas  por  los  grados 
de  libertad  apropiados,  da  una  estimation  de  la  variacion  en  el  experimento.  Como  SS 
Total  contiene  n  =  bk  observaciones  al  cuadrado,  sus  grados  de  libertad  son  df  =  (n  — 
1).  Del  mismo  modo,  SST  contiene  k  totales  al  cuadrado  y  sus  grados  de  libertad  son 
df  =  {k  —  1),  en  tanto  que  SSB  contiene  b  totales  al  cuadrado  y  (b  —  1)  grados  de 
libertad.  Finalmente,  como  los  grados  de  libertad  son  aditivos,  los  restantes  grados  de  li¬ 
bertad  asociados  con  SSE  se  puede  demostrar  algebraic amente  que  son  df  =  (b  —  1) 
(k  -  1). 

Estas  tres  fuentes  de  variacion  y  sus  respectivos  grados  de  libertad  se  combinan  para 
formar  los  medios  cuadraticos  como  MS  =  SS/df  y  la  variacion  total  en  el  experimento 
se  exhibe  entonces  en  una  tabla  de  analisis  de  varianza  (o  ANOYA)  como  se  muestra 
a  continuation: 
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Los  grados  de  libertad 
son  aditivos. 


TABLA  ANOVA  PARA  UN  DISENO  DE  BLOQUE 
ALEATORIZADO,  k  TRATAMIENTOS  Y  b  BLOQUES 


Fuente 

df 

SS 

MS 

F 

Tratamientos 

k=  1 

SST 

MST  =  SST/(f  -  1) 

MST/MSE 

Bloques 

b-  1 

SSB 

MSB  =  SSB/(6  —  1) 

MSB/MSE 

Error 

{b-m- 1) 

SSE 

CO 

m 

II 

CO 

CO 

m 

Cr 

1 

1 

Total  n  =  1  =  bk  —  1 


La  industria  de  la  telefonfa  celular  esta  involucrada  en  una  feroz  batalla  por  clientes, 
con  cada  compama  ideando  su  propio  y  complejo  plan  de  precios  para  atraer  clientes. 
Como  el  costo  de  un  minuto  por  telefono  celular  varfa  en  forma  drastica  dependiendo  del 
numero  de  minutos  por  mes  usados  por  el  cliente,  un  grupo  de  vigilancia  integrado  por 
consumidores  decidio  comparar  el  promedio  de  costos  de  cuatro  companfas  de  telefonfa 
celular  usando  tres  diferentes  niveles  de  uso  como  bloques.  Los  costos  mensuales  (en 
dolares),  calculados  por  las  companfas  de  telefonfa  celular  para  usuarios  de  tiempo  pico 
en  bajos  (20  minutos  por  mes),  medios  (150  minutos  por  mes)  y  altos  (1000  minutos  por 
mes)  niveles  de  uso,  se  dan  en  la  tabla  11.3.  Construya  la  tabla  de  analisis  de  varianza 
para  este  experimento. 


tabla  11.3  Costos  mensuales  de  telefono  para  cuatro  companfas  a  tres  niveles  de  uso 


Nivel  de  uso 

Compama 

A 

B 

C 

D 

Totales 

Bajo 

27 

24 

31 

23 

B,  =  105 

Medio 

68 

76 

65 

67 

fi2  =  276 

Alto 

308 

326 

312 

300 

B3  =  1246 

Totales 

7i  =  403 

T2  =  426 

CO 

o 

■=d- 

II 

h-T 

II 

CO 

CO 

CD 

G  =  1627 

CONSEJO 


Los  bloques  contienen 
unidades  experimentales 
que  son  relativamente  las 
mismas. 


Solucion  El  experimento  esta  disenado  como  diseno  de  bloque  aleatorizado  con 
b  =  3  niveles  de  uso  (bloques)  y  k  =  4  companfas  (tratamientos),  de  modo  que  hay 
n  =  bk  =  12  observaciones  y  G  =  1627.  Entonces 

CM  =  7T  =  =  220594.0833 


SS  Total  =  (2T  +  242  +  •  •  •  +  3002)  -  CM  =  189798.9167 
4032  +  •  ■  •  +  3902 

SST  =  - - - CM  =  222.25 


SSB  = 


1052 +  2762 +  12462 


-  CM  =  189335.1667 


y  por  sustraccion, 

SSE  =  SS  Total  -  SST  -  SSB  =241.5 


Estas  cuatro  fuentes  de  variation,  sus  grados  de  libertad,  sumas  de  cuadrados  y  medios 
cuadraticos  se  muestran  en  el  area  sombreada  de  la  tabla  de  analisis  de  varianza,  gene- 
rado  por  MINITAB  y  se  dan  en  la  figura  11.10.  Encontrara  instrucciones  para  general-  esta 
salida  impresa  en  la  section  “Mi  MINITAB”  al  final  de  este  capftulo. 
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FIGURA  11.10 

Salida  impresa  MINITAB 
para  el  Ejemplo  11.8 


ANOVA  de  dos  vi'as:  dolares  contra  uso,  companfa 


Source 

DF 

SS 

MS 

F 

P 

Usage 

2 

189335 

94667 . 6 

2351.99 

0.000 

Company 

3 

222 

74 . 1 

1 . 84 

0.240 

Error 

6 

242 

40.3 

Total 

11 

189799 

S  =  6.344  R-Sq  =  99.87%  R-Sq(adj)  =  99.77% 


Observe  que  la  tabla  ANOVA  MINITAB muestra  dos  diferentes  estadfsticas  F  y  valores 
de  p.  No  debe  sorprender  el  saber  que  estas  estadfsticas  se  usan  para  probar  hipotesis 
respecto  a  la  igualdad  de  medias  de  tratamiento  y  de  bloque. 


Prueba  de  la  igualdad  de  las  medias 
de  tratamiento  y  de  bloque 

Los  medios  cuadrdticos  de  la  tabla  de  analisis  de  varianza  se  pueden  usar  para  probar 
las  hipotesis  nulas 

H0 :  No  hay  diferencia  entre  las  lc  medias  de  tratamiento 
o  bien 


Hq  :  No  hay  diferencia  entre  las  b  medias  de  bloque 
contra  la  hipotesis  alternativa 

Hd :  A1  menos  una  de  las  medias  es  diferente  de  al  menos  otra 


con  el  uso  de  un  argumento  teorico  similar  al  empleado  para  el  diseno  completamente 
aleatorizado. 


•  Recuerde  que  a 2  es  la  varianza  comun  para  las  observaciones  en  todas  las  bk 
combinaciones  de  bloque-tratamiento.  La  cantidad 


MSE 


SSE _ 

(b  -  1)(*  -  1) 


es  una  estimacion  insesgada  de  cr2,  sea  o  no  sea  verdadera  H0. 


•  Las  dos  cuadraticas  medias,  MST  y  MSB,  estiman  cr2  solo  si  H0  es  verdadera 
y  tienden  a  ser  inusualmente  grandes  si  H0  es  falsa  y  ya  sea  que  las  medias  de 
tratamiento  o  de  bloque  sean  diferentes. 


•  Las  estadfsticas  de  prueba 


p  =  MST 
MSE 


MSB 

MSE 


se  usan  para  probar  la  igualdad  de  medias  de  tratamiento  y  de  bloque,  respectiva- 
mente.  Ambas  estadfsticas  tienden  a  ser  mas  grandes  de  lo  normal  si  H0  es  falsa. 
En  consecuencia,  se  puede  rechazar  H0  para  valores  grandes  de  F,  usando  valores 
crfticos  de  cola  derecha  de  la  distribution  F  con  los  grados  de  libertad  apropia- 
dos  (vease  la  tabla  6  del  apendice  I)  o  valores  p  generados  por  computadora  para 
sacar  conclusiones  estadfsticas  acerca  de  la  igualdad  de  las  medias  poblacionales. 
Como  alternativa,  se  puede  usar  el  applet  F  Probabilities  para  hallar  ya  sea  valo¬ 
res  crfticos  de  F  o  valores  p. 
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PRUEBAS  PARA  UN  DISENO  DE  BLOQUE 

ALEATORIZADO 

Para  comparar  medias  de  tratamiento: 

1 .  Hipotesis  nula:  H0 :  Las  medias  de  tratamiento  son  iguales 

2.  Hipotesis  alternativa:  Ha :  A1  menos  dos  de  las  medias  de  tratamiento  difieren 

3.  Prueba  estadfstica:  F  =  MST/MSE,  donde  F  esta  basada  en  dfl  =  (k—  1)  y 
df2  =  (b-  m  -  1) 

4.  Region  de  rechazo:  rechazar  si  F  >  Fa,  donde  Fa  se  encuentra  en  la  cola  superior 
de  la  distribucion  F  (vease  la  figura),  o  cuando  el  valor  p  <  a 

Para  comparar  medias  de  bloque: 

1 .  Hipotesis  nula:  H0 :  Las  medias  de  bloque  son  iguales 

2.  Hipotesis  alternativa:  Ha :  A1  menos  dos  de  las  medias  de  bloque  difieren 

3.  Prueba  estadfstica:  F  =  MSB/MSE,  donde  F  esta  basada  en  dfx  =  (b  —  1)  y 
dub  -  m  -  i) 

4.  Region  de  rechazo:  rechazar  si  F  >  Fa,  donde  Fa  se  encuentra  en  la  cola  superior 
de  la  distribucion  F  (vease  la  figura),  o  cuando  el  valor;?  <  a 


;Los  datos  del  ejemplo  11.8  dan  suficiente  evidencia  para  indicar  una  diferencia  en  el 
promedio  de  costo  mensual  de  telefono  celular,  dependiendo  de  la  companfa  que  use 
el  cliente? 


Soluciom  Las  companfas  de  telefonfa  celular  representan  los  tratamientos  en  este 
diseno  de  bloque  aleatorizado  y  las  diferencias  en  el  promedio  de  sus  costos  mensuales 
son  de  primordial  importancia  para  el  investigador.  Para  probar 

Hq  :  No  hay  diferencia  en  el  promedio  de  costo  entre  compamas 


contra  la  alternativa  de  que  el  promedio  de  costo  es  diferente  para  al  menos  una  de  las 
cuatro  companfas,  se  usa  el  analisis  de  varianza  de  la  estadfstica  F,  calculado  como 


MST  _  744 
MSE  ~  40.3 


1.84 


y  se  muestra  en  la  columna  marcada  “F”  y  el  renglon  marcado  “Companfa”  en  la  figura 
1 1.10.  El  valor  p  exacto  para  esta  prueba  estadfstica  tambien  se  da  en  la  figura  1 1.10 
como  .240,  que  es  demasiado  grande  para  permitir  el  rechazo  de  H0.  Los  resultados  no 
muestran  una  diferencia  significativa  en  las  medias  de  tratamiento.  Esto  es,  hay  insufi- 
ciente  evidencia  para  indicar  una  diferencia  en  el  promedio  de  costos  mensuales  para  las 
cuatro  companfas. 
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El  investigador  del  ejemplo  11.9  estaba  bastante  seguro  de  que  al  usar  un  diseno  de 
bloque  aleatorizado  habrfa  una  diferencia  significativa  en  las  medias  de  bloque,  es  decir, 
una  diferencia  significativa  en  el  promedio  de  costos  mensuales  dependiendo  del  nivel 
de  uso.  Esta  sospecha  esta  justificada  al  ver  la  prueba  de  igualdad  de  medias  de  bloque. 
Observe  que  la  prueba  estadlstica  observada  es  F  =  2351.99  con  P  =  .000,  mostrando 
una  diferencia  altamente  significativa,  como  se  esperaba,  en  las  medias  de  bloque. 

Identificacion  de  diferencias  en  las  medias 
de  tratamiento  y  de  bloque 

Una  vez  efectuada  la  prueba  F  general  para  igualdad  de  las  medias  de  tratamiento  o  de 
bloque,  £que  mas  se  puede  hacer  para  identificar  la  naturaleza  de  cualesquiera  diferen¬ 
cias  que  se  hayan  encontrado?  Al  igual  que  en  la  seccion  1 1.5,  se  puede  usar  el  metodo 
de  Tukey  de  comparaciones  apareadas  para  determinar  que  pares  de  medias  de  trata¬ 
miento  o  de  bloque  son  significativamente  diferentes  uno  de  otro.  No  obstante,  si  la 
prueba  F  no  indica  una  diferencia  significativa  en  las  medias,  no  hay  razon  para  usar  el 
procedimiento  de  Tukey.  Si  el  investigador  tiene  especial  interes  en  un  par  particular  de 
medias  de  tratamiento  o  de  bloque,  puede  estimar  la  diferencia  usando  un  interva- 
lo  de  confianza  (1  —  a)  1 00%'.  Las  formulas  para  estos  procedimientos,  que  se  mues- 
tran  a  continuation,  siguen  un  patron  similar  a  las  formulas  para  el  diseno  completa- 
mente  aleatorizado.  Recuerde  que  MSE  siempre  da  un  estimador  insesgado  de  a2  y 
utiliza  information  proveniente  de  todo  el  conjunto  de  mediciones.  En  consecuencia,  es 
el  mejor  estimador  existente  de  a2,  cualquiera  que  sea  el  procedimiento  de  prueba  o  es¬ 
timation  que  se  use.  Utilice  de  nuevo 

y2  =  MSE  con  df=(b~  1  )(k  -  1) 

para  estimar  er  al  comparar  las  medias  de  tratamiento  y  de  bloque. 


COMPARACION  DE  MEDIAS  DE  TRATAMIENTO 
Y  DE  BLOQUE 

Medidor  de  Tukey  para  comparar  medias  de  bloque: 
co  =  qa{b, 

Medidor  de  Tukey  para  comparar  medias  de  tratamiento: 
w  =  qa(k,  df)(-j=\ 

Intervalo  de  confianza  de  (1  —  a)  100%  para  la  diferencia  en  dos  medias  de  bloque: 
<B,  -  B,)  ±  + 

donde  E,  es  el  promedio  de  todas  las  observaciones  en  el  bloque  i 

Intervalo  de  confianza  de  (1  —  a)  100%  para  la  diferencia  en  dos  medias  de  trata¬ 
miento: 

<t<-P±  '-fti+Ij 

donde  Tt  es  el  promedio  de  todas  las  observaciones  en  el  tratamiento  i. 

f  No  se  puede  construir  un  intervalo  de  confianza  para  una  media  individual,  a  menos  que  los  bloques  hayan  sido 
seleccionados  al  azar  de  entre  la  poblacion  de  todos  los  bloques.  El  procedimiento  para  construir  intervalos  para 
medias  individuales  esta  fuera  del  proposito  de  este  libro. 


Los  grados  de  libertad  para 
la  prueba  de  Tukey  y  para 
intervalos  de  confianza  son 

los  df  de  error. 
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No  se  puede  formar  un 
intervalo  de  confianza  o 
probar  una  hipotesis  acerca 
de  una  media  de  tratamiento 
individual  en  un  diseno  de 
bloque  aleatorizado. 


Nota:  Los  valores  qa(*,  df)  de  la  tabla  1 1  en  el  apendice  I,  ta/2  de  la  tabla  4  en  el  apen- 
dice  I  y  i2  =  MSE  dependen  todos  ellos  d edf=(b—  I  )(k  —  1)  grados  de  libertad. 

Identifique  la  naturaleza  de  cualesquiera  diferencias  encontradas  en  el  promedio  de  cos- 
tos  mensuales  de  telefono  celular  del  ejemplo  1 1.8. 

Solucion  Como  la  prueba  F  no  presento  diferencias  significativas  en  los  costos  pro¬ 
medio  para  las  cuatro  compamas,  no  hay  razon  para  usar  el  metodo  de  Tukey  de  compa- 
raciones  apareadas.  Supongamos,  sin  embargo,  que  usted  es  un  ejecutivo  de  la  compama 
B  y  su  principal  competidor  es  la  compama  C.  Puede  decir  que  hay  una  diferencia  sig- 
nificativa  en  los  dos  costos  promedio?  Usando  un  intervalo  de  confianza  de  95%,  puede 
calcular 


de  modo  que  la  diferencia  entre  los  dos  costos  promedio  se  estiman  entre  —$6.68  y 
$18.68.  Como  0  esta  contenido  en  el  intervalo,  no  tiene  evidencia  para  indicar  una  dife¬ 
rencia  significativa  en  sus  costos  promedio.  ;Que  pena! 


Algunos  comentarios  de  precaucion 
en  bloqueo 

A  continuation  veamos  algunos  puntos  importantes  a  recordar: 

•  Un  diseno  de  bloque  aleatorizado  no  debe  usarse  cuando  tanto  tratamientos  como 
bloques  corresponden  a  factores  experimentales  de  interes  para  el  investigador. 
A1  disenar  un  factor  como  bloque,  puede  suponer  que  el  efecto  del  tratamiento 
sera  el  mismo,  cualquiera  que  sea  el  bloque  que  utilice.  Si  este  no  es  el  caso,  los 
dos  factores,  bloques  y  tratamientos,  se  dice  que  interactuan  y  el  analisis  podria 
llevar  a  conclusiones  incorrectas  respecto  a  la  relation  entre  los  tratamientos  y  la 
respuesta.  Cuando  se  sospeche  que  hay  una  interaccion  entre  dos  factores,  deben 
analizarse  los  datos  como  experimento  factorial,  que  se  introduce  en  la  siguien- 
te  section. 

•  Recuerde  que  el  bloqueo  puede  no  ser  siempre  benefico.  Cuando  el  SSB  se  elimi- 
ne  del  SSE,  el  numero  de  grados  de  libertad  asociado  con  el  SSE  se  reduce.  Para 
que  el  bloqueo  sea  benefico,  la  information  ganada  al  aislar  la  variation  de 
bloque  debe  importar  mas  que  la  perdida  de  grados  de  libertad  por  error,  pero, 
por  lo  general,  si  se  sospecha  que  las  unidades  experimentales  no  son  homoge- 
neas  y  se  pueden  agrupar  las  unidades  en  bloques,  es  bueno  usar  el  diseno  de 
bloque  aleatorizado. 

•  Por  ultimo,  recuerde  que  no  se  pueden  construir  intervalos  de  confianza  para 
medias  de  tratamiento  individuals  a  menos  que  sea  razonable  suponer  que  los 
b  bloques  se  han  seleccionado  al  azar  de  entre  una  poblacion  de  bloques.  Si  el 
experimentador  construye  ese  intervalo,  la  media  de  tratamiento  muestral  estara 
sesgada  por  los  efectos  positivos  y  negativos  que  los  bloques  tienen  en  la  res¬ 
puesta. 


No  se  puede  formar  un 
intervalo  de  confianza  o 
probar  una  hipotesis  acerca 
de  una  media  de  tratamiento 
individual  en  un  diseno  de 
bloque  aleatorizado. 
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EJERCICIOS 


TECNICAS  BASICAS 

1 1 .28  Se  utilizo  un  diseno  de  bloque  aleatorizado  para 
comparar  las  medias  de  tres  tratamientos  dentro  de  seis 
bloques.  Construya  una  tabla  ANOVA  que  muestre  las 
fuentes  de  variacion  y  sus  respectivos  grados  de  libertad. 

1 1 .29  Suponga  que  los  calculos  del  analisis  de  varianza 
para  el  ejercicio  1 1.28  son  SST  =  11.4,  SSB  =  17.1  y 
SS  Total  =  42.7.  Complete  la  tabla  ANOVA,  mostrando 
todas  las  sumas  de  cuadrados,  medios  cuadraticos  y 
valores  F  pertinentes. 

1 1 .30  (',Los  datos  del  ejercicio  11.28  dan  suficiente 
evidencia  para  indicar  diferencias  entre  las  medias  de 
tratamiento?  Pruebe  usando  a  =  .05. 

1 1 .31  Consulte  el  ejercicio  1 1.28.  Encuentre  un 
intervalo  de  confianza  de  95%  para  la  diferencia  entre  un 
par  de  medias  de  tratamiento  A  y  B  si  7A  =  21.9  y 

xB  =  24.2. 

1 1 .32  (-.Los  datos  del  ejercicio  1 1.28  dan  suficiente 
evidencia  para  indicar  que  el  bloque  aumento  la  cantidad 
de  information  en  el  experimento  acerca  de  las  medias  de 
tratamiento?  Justifique  su  respuesta. 

datos  1 1 .33  Los  datos  que  siguen  son  observaciones 
recolectadas  de  un  experimento  que  comparo 
cuatro  tratamientos,  A,  B,  C  y  D,  dentro  de  cada  uno  de 
tres  bloques,  usando  un  diseno  de  bloque  aleatorizado. 


Tratamiento 


Bloque 

A 

B 

C 

D 

Total 

1 

B 

10 

8 

9 

33 

2 

4 

9 

5 

7 

25 

3 

12 

15 

14 

14 

55 

Total 

22 

34 

27 

30 

113 

a.  ^Los  datos  presentan  suficiente  evidencia  para  indicar 
diferencias  entre  las  medias  de  tratamiento?  Pruebe 
usando  a  =  .05. 

b.  (',Los  datos  presentan  suficiente  evidencia  para  indicar 
diferencias  entre  las  medias  de  bloque?  Pruebe  usando 
a  =  .05. 

c.  Clasifique  las  cuatro  medias  de  tratamiento  usando  el 
metodo  de  Tukey  de  comparaciones  pareadas  con 

a  =  .01. 

d.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  medias  para  tratamientos  A  y  B. 

e.  (\  Le  parece  que  el  uso  de  un  diseno  de  bloque 
aleatorizado  para  este  experimento  estaba  justificado? 
Explique. 


(^jg)  datos  1 1 .34  Los  datos  mostrados  a  continuacion  son 
observaciones  recolectadas  de  un  experimento 
que  comparo  tres  tratamientos,  A,  B  y  C,  dentro  de 
cada  uno  de  cinco  bloques,  usando  un  diseno  de  bloque 
aleatorizado: 


Bloque 


Tratamiento 

1 

2 

3 

4 

5 

Total 

A 

2.1 

2.B 

1.9 

3.2 

2.7 

12.5 

B 

3.4 

3.8 

3.B 

4.1 

3.9 

18.8 

C 

3.0 

3.B 

3.2 

3.9 

3.9 

17.6 

Total 

8.5 

10.0 

8.7 

11.2 

10.5 

48.9 

Salida  impresa  MINITAB  para  el  ejercicio  1 1 .34 

ANOVA  en  dos  vias:  respuesta  contra  tratamientos,  bloques 


Source 

DF 

SS 

MS 

F 

Trts 

2 

4.476 

2.238 

79 . 93 

Blocks 

4 

1.796 

0.449 

16 . 04 

Error 

8 

0.224 

0 . 028 

Total 

14 

6.496 

S  =  0.1673 

R-Sq  = 

96.55% 

R-Sq (adj ) 

i  =  93 

Use  la  salida  impresa  MINITAB  para  analizar  el 
experimento.  Investigue  posibles  diferencias  en  las 
medias  de  bloque  y/o  tratamiento  y,  si  existen  algunas 
diferencias,  use  un  metodo  apropiado  para  identificar 
especfficamente  donde  estan  las  diferencias.  (',EI  bloqueo 
ha  sido  efectivo  en  este  experimento?  Presente  sus 
resultados  en  la  forma  de  un  reporte. 

1 1 .35  La  tabla  ANOVA  parcialmente  completada 
para  un  diseno  de  bloque  aleatorizado  se  presenta  a 
continuacion: 

Fuente  df  SS  MS  F 

Tratamientos  4  14.2 

Bloques  18.9 

Error  24 

Total  34  41.9 

a.  ^Cu  antes  bloques  intervienen  en  el  diseno? 

b.  ^Cuantas  observaciones  hay  en  cada  total  de 
tratamiento? 

c.  <',CL|antas  observaciones  hay  en  cada  total  de  bloque? 

d.  Llene  los  espacios  en  bianco  de  la  tabla  ANOVA. 

e.  ^Los  datos  presentan  suficiente  evidencia  para  indicar 
diferencias  entre  las  medias  de  tratamiento?  Pruebe 
usando  a  =  .05. 

f.  /.Los  datos  presentan  suficiente  evidencia  para  indicar 
diferencias  entre  las  medias  de  bloque?  Pruebe  usando 
a  =  .05. 
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APLICACIONES 

datos  1 1.36  Bendimiento  de  gasolina  Se  realizo 
un  estudio  para  comparar  el  rendimiento  de 
gasolina  en  automoviles  para  tres  formulas  de  gasolina. 

A  era  una  formula  sin  plomo  y  87  octanos,  B  era  una 
formula  sin  plomo  y  91  octanos  y  C  era  una  formula  sin 
plomo  de  87  octanos  con  15%  de  etanol.  Se  utilizaron 
cuatro  automoviles,  todos  ellos  de  la  misma  marca  y 
modelo,  y  cada  formula  se  probo  en  cada  uno  de  los 
autos.  El  uso  de  cada  formula  en  el  mismo  auto  tiene 
el  efecto  de  eliminar  (bloqueo)  variabilidad  de  un 
auto  a  otro.  Los  datos  (en  millas  por  galon)  se  dan  a 
continuation. 


Automovil 


Formula 

1 

2 

3 

4 

A 

25.7 

27.0 

27.3 

26.1 

B 

27.2 

28.1 

27.9 

27.7 

C 

26.1 

27.5 

26.8 

27.8 

a.  ^Los  datos  presentan  suficiente  evidencia  para  indicar 
diferencias  en  distancia  media  en  millas  por  galon 
para  las  tres  formulas  de  gasolina? 

b.  ^Hay  suficiente  evidencia  de  una  diferencia  en 
distancia  media  en  millas  para  los  cuatro  automoviles? 

c.  Suponga  que  antes  de  ver  los  datos,  se  ha  decidido 
comparar  la  distancia  media  en  millas  por  galon 
para  las  formulas  A  y  B.  Encuentre  un  intervalo 
de  confianza  de  90%  para  esta  diferencia. 

d.  Use  un  metodo  apropiado  para  identificar  las 
diferencias  por  pares,  si  las  hay,  en  el  promedio  de 
las  distancias  medias  para  las  tres  formulas. 

(^) datos  1 1.37  Resistencia  al  agua  en  textiles 

Se  realizo  un  experimento  para  comparar  los 
efectos  de  cuatro  productos  qulmicos  diferentes,  A, 

B,  C  y  D,  para  producir  resistencia  al  agua  en  textiles. 
Una  tira  de  material,  seleccionada  de  un  rollo  de  tela,  se 
corto  en  cuatro  partes  y  todas  estas  se  asignaron  al  azar 
para  recibir  uno  de  los  cuatro  productos  qulmicos,  A,  B, 

C  y  D.  Este  proceso  se  repitio  tres  veces,  produciendo 
as!  un  diseno  de  bloque  aleatorizado.  Este  diseno,  con 
mediciones  de  resistencia  a  la  humedad,  se  muestra  en  la 
figura  siguiente  (bajas  lecturas  indican  baja  penetration 
de  humedad).  Analice  el  experimento  usando  un  metodo 
apropiado  para  este  diseno  de  bloque  aleatorizado. 
Identifique  los  bloques  y  tratamientos  e  investigue 
cualesquiera  diferencias  en  medias  de  tratamiento. 

Si  existen  diferencias,  use  un  metodo  apropiado  para 
identificar  especlficamente  donde  se  encuentran  las 
diferencias.  ('C  miles  son  las  implicaciones  practicas  para 
los  productores  de  las  sustancias  qulmicas?  (jEI  bloqueo 
ha  sido  eficaz  en  este  experimento?  Presente 
sus  resultados  en  forma  de  un  reporte. 


Ilustracion  para  el  ejercicio  11.37 

Bloques  (muestras  de  rollo) 


1  2  3 


C 

D 

B 

9.9 

13.4 

12.7 

A 

B 

D 

10.1 

12.9 

12.9 

B 

A 

C 

11.4 

12.2 

11.4 

D 

C 

A 

12.1 

12.3 

11.9 

1 1.38  Deslumbramiento  en  espejos  retrovisores 

Se  realizo  un  experimento  para  comparar  las 
caracterlsticas  de  deslumbramiento  de  cuatro  tipos 
de  espejos  retrovisores  en  automoviles.  Cuarenta 
conductores  se  seleccionaron  al  azar  para  participar  en  el 
experimento;  cada  uno  fue  expuesto  a  deslumbramiento 
producido  por  una  luz  delantera  situada  a  30  pies 
detras  de  la  ventanilla  trasera  del  auto  experimental. 

El  conductor  clasifico  entonces  el  deslumbramiento 
producido  por  el  espejo  retro  visor  en  una  escala  de  1 
(bajo)  a  10  (alto).  Cada  uno  de  los  cuatro  espejos  fue 
probado  por  cada  conductor;  los  espejos  se  asignaron  a 
un  conductor  en  orden  aleatorio.  Un  analisis  de  varianza 
de  los  datos  produjo  esta  tabla  ANOVA: 

Fuente  df  SS  MS  F 

Espejos  46.98 

Conductores  8.42 

Error 

Total  638.61 

a.  Llene  los  espacios  en  bianco  de  la  tabla  ANOVA. 

b.  (:,Los  datos  presentan  suficiente  evidencia  para 
indicar  diferencias  en  las  clasificaciones  medias  de 
deslumbramiento  de  los  cuatro  espejos  retrovisores? 
Calcule  el  valor  p  aproximado  y  uselo  para  tomar  su 
decision. 

c.  (:,Los  datos  presentan  suficiente  evidencia  para  indicar 
que  el  nivel  de  deslumbramiento  percibido  por  los 
conductores  vario  de  un  conductor  a  otro?  Use  el 
metodo  del  valor  p. 

d.  Con  base  en  los  resultados  del  inciso  b),  ^cuales  son 
las  implicaciones  practicas  de  este  experimento  para 
los  fabricantes  de  los  espejos  retrovisores? 

<^)datos  11.39  Plantar  pinos  ayacahuites  Se 

realizo  un  experimento  para  determinar  los 
efectos  de  tres  metodos  de  preparacion  del  terreno  en 
el  primer  ano  de  crecimiento  de  semillas  de  ayacahuite. 
Se  seleccionaron  cuatro  lugares  (terrenos  de  bosques 
estatales)  y  cada  lugar  se  dividio  en  tres  lotes.  Como  se 
tenia  la  impresion  de  que  la  fertilidad  del  suelo  dentro 
de  un  lugar  era  mas  homogenea  que  entre  lugares,  se 
utilizo  un  diseno  de  bloques  aleatorizado  usando  lugares 
como  bloques.  Los  metodos  de  preparacion  del  terreno 
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fueron  A  (sin  preparation),  B  (ligera  fertilization)  y 
C  (quema).  Cada  preparacion  del  terreno  se  aplico  al 
azar  a  un  lote  dentro  de  cada  lugar.  En  cada  lote,  el 
mismo  numero  de  semillas  se  planto  y  el  promedio  de 
crecimiento  de  primer  ano  de  las  semillas  se  registro 
en  cada  lote.  Use  la  salida  impresa  del  MINITAB  para 
contestar  las  preguntas. 

Lugar 

Terreno 


Preparacion 

1  2 

3 

4 

A 

11  13 

16 

10 

B 

15  17 

20 

12 

C 

10  15 

13 

10 

a.  Efectue  un  analisis  de  varianza.  ^Los  datos  dan 
suficiente  evidencia  para  indicar  una  diferencia  en  los 
crecimientos  medios  para  las  tres  preparaciones  del 
terreno? 

b.  (',Hay  evidencia  para  indicar  una  diferencia  en  porcen- 
tajes  medios  de  crecimiento  para  los  cuatro  lugares? 

c.  Use  el  metodo  de  Tukey  de  comparaciones  apareadas 
para  clasificar  los  crecimientos  medios  para  las  tres 
preparaciones  del  terreno.  Use  a  =  .01. 

d.  Use  un  intervalo  de  confianza  de  95%  para  estimar  la 
diferencia  en  crecimientos  medios  para  los  metodos 
A  y  B. 


Salida  impresa  del  MINITAB  para  el  ejercicio  11.39 

ANOVA  en  dos  vlas:  crecimiento  contra  prep,  de  terreno,  lugar 


Source 
Soil  Prep 
Location 
Error 
Total 


Location 


SS 

38 . 000 
61.667 
11.333 
111.000 


19.0000  10.06 

20.5556  10.88 

1.8889 


0 . 012 
0 . 008 


1.374  R-Sq  =  89.79%  R-Sq(adj)  =  81.28 


Soil  Prep 


Mean 
12.5 
16 . 0 
12 . 0 


Mean 
12 . 0000 
15 . 0000 
16.3333 
10.6667 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 


(^)datos  1 1.40  Dedalera  e  ingesta  de  calcio  Se 

realizo  un  estudio  para  comparar  los  efectos 
de  tres  niveles  de  dedalera  en  los  niveles  de  calcio  en 


los  musculos  cardiacos  de  perros.  Debido  a  que  el  nivel 
general  de  ingesta  de  calcio  varfa  de  un  animal  a  otro,  el 
tejido  para  un  musculo  cardiaco  se  considero  como  un 
bloque  y  se  hicieron  comparaciones  de  los  tres  niveles  de 
dedalera  (tratamientos)  dentro  de  un  animal  determinado. 
Las  ingestas  de  calcio  para  los  tres  niveles  de  dedalera, 

A,  B  y  C,  fueron  comparados  con  base  en  los  musculos 
cardiacos  de  cuatro  perros  y  los  resultados  se  dan  en  la 
tabla  siguiente. 


Perros 


1 

2 

3 

4 

A 

C 

B 

A 

1342 

1698 

1296 

1150 

B 

B 

A 

C 

1608 

1387 

1029 

1579 

C 

A 

C 

B 

1881 

1140 

1549 

1319 

a.  ('.Qiantos  grados  de  libertad  estan  asociados  con  el 
SSE? 

b.  ^Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  las  ingestas  medias  de  calcio 

para  los  tres  niveles  de  dedalera? 

c.  Use  el  metodo  de  Tukey  de  comparaciones  con 

a  =  .01  para  clasificar  las  ingestas  medias  de  calcio 
para  los  tres  niveles  de  dedalera. 

d.  <^Los  datos  indican  una  diferencia  en  las  ingestas 
medias  de  calcio  para  los  cuatro  musculos  cardiacos? 

e.  Use  el  metodo  de  Tukey  de  comparaciones  apareadas 
con  a  =  .01  para  clasificar  las  ingestas  medias  de 
calcio  para  los  musculos  cardiacos  de  los  cuatro  perros 
empleados  en  el  experimento.  (:,Estos  resultados  son  de 
algun  valor  practico  para  el  investigador? 

f.  De  el  error  estandar  de  la  diferencia  entre  las  ingestas 
medias  de  calcio  para  dos  niveles  de  dedalera. 

g.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  respuestas  medias  entre  los  tratamientos 
Ay  B. 

Salida  impresa  del  MINITAB  para  el  ejercicio  11.40 

ANOVA  en  dos  vias:  ingesta  contra  dedalera,  perros 


Source 

Digitalis 

Dog 

Error 

Total 


DF  SS 

2  542177 

3  173415 

6  6090 

11  703682 


MS  F 

262089  258.24 

57805  56.96 

1015 


P 

0 . 000 
0 . 000 


S  =  31.86  R-Sq  =  99.13% 


R-Sq (adj ) 


98.41% 


Digitalis 

1 

2 

3 


Dog 

1 

2 

3 

4 


Mean 

1165.25 

1402.50 

1676.75 


Mean 

1610.33 

1408.33 

1291.33 

1349.33 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 


(-*-) 

(-• 

-*-) 

(--*-) 

1200 

1350 

1500 

1650 

Individual  95%  CIs 
Pooled  StDev 

For  Mean 

Based  on 

( 

(- 

(  — *- 

--) 

1320 

1440 

1560 

1680 

((^datos  1 1 .41  Cotizaciones  en  trabajos  de 
Exii4i  construction  Un  contratista  constructor 


emplea  tres  ingenieros  de  construction.  A,  B  y  C, 
para  estimar  y  cotizar  trabajos.  Para  determinar  si  uno 
tiende  a  ser  estimador  mas  conservador  (o  liberal)  que 
los  otros,  el  contratista  selecciona  cuatro  trabajos  de 
construction  proyectados  y  hace  que  cada  estimador,  en 
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forma  independiente,  estime  el  costo  (en  dolares  por  pie 
cuadrado)  de  cada  trabajo.  Los  datos  se  muestran  en  la 
tabla  siguiente: 


Trabajo  de  construccion 


Estimador 

1 

2 

3 

4 

Total 

A 

35.10 

34.50 

29.25 

31.60 

130.45 

B 

37.45 

34.60 

33.10 

34.40 

139.55 

C 

36.30 

35.10 

32.45 

32.90 

136.75 

Total 

108.85 

104.20 

94.80 

98.90 

406.75 

Analice  el  experimento  usando  los  metodos  apropiados. 
Identifique  los  bloques  y  tratamientos  e  investigue 
cualesquiera  diferencias  en  medias  de  tratamiento. 

Si  existe  alguna,  use  un  metodo  apropiado  para 
identificar  de  manera  especifica  en  donde  se  encuentran 
las  diferencias.  (jEI  bloqueo  ha  sido  efectivo  en  este 
experimento?  (',Cuales  son  las  implicaciones  practicas 
del  experimento?  Presente  sus  resultados  en  forma  de 
reporte. 

(^)datos  11.42  "En  buenas  manos"  El  costo  de 
asegurar  automoviles  varia  segiin  el  lugar, 
edades  de  los  conductores  y  tipo  de  cobertura.  Las 
siguientes  son  estimaciones  para  la  prima  anual  2006- 
2007  para  un  hombre  soltero,  con  licencia  de  6-8  anos, 
que  maneja  un  Honda  Accord  de  12600  a  15000  millas 
por  ano  y  no  tiene  infracciones  ni  accidentes.  Estas 
estimaciones  son  dadas  por  el  Departamento  de  Seguros 
de  California  para  el  ano  2006-2007  en  su  sitio  web 
(http://insurance.ca.gov).2 


Compania  de  seguros 


Lugar 

21st 

Century 

Allstate 

AAA 

Fireman’s 

Fund 

State 

Farm 

Riverside 

$1870 

$2250 

$2154 

$2324 

$3053 

San  Bernardino 

2064 

2286 

2316 

2005 

3151 

Hollywood 

3542 

3773 

3235 

3360 

3883 

Long  Beach 

2228 

2617 

2681 

3279 

3396 

Fuente:  www.insurance.ca.gov 

a.  ^Que  tipo  de  diseno  se  utilizo  para  recolectar  estos 
datos? 

b.  ^Hay  suficiente  evidencia  para  indicar  que  las  primas 
de  seguro  para  el  mismo  tipo  de  cobertura  difiere  de 
una  compania  a  otra? 

c.  ^Hay  suficiente  evidencia  para  indicar  que  las  primas 
de  seguro  varian  de  un  lugar  a  otro? 

d.  Use  el  procedimiento  de  Tukey  para  determinar  cuales 
companias  de  seguros  citadas  aqui  difieren  de  otras 

en  las  primas  que  cobran  para  este  cliente  tipico.  Use 
a  =  .05. 

e.  Haga  un  resumen  de  lo  que  encuentre. 

(J)  datos  1 1.43  Compras  en  tiendas  grandes 
Tiendas  grandes  como  Costco  y  Sam’s 


Club  son  de  las  preferidas  para  compras  de  muchos 
estadounidenses,  por  el  bajo  costo  asociado  con  compras 
a  granel.  Cuando  una  nueva  tienda  grande  llamada 
WinCo  Foods  abrio  en  Moreno  Valley,  California,  un 
anuncio  por  correo  decia  que  eran  el  “lider  en  precios 
bajos  en  la  zona”3.  Compararon  sus  precios  con  los 
de  otras  cuatro  tiendas  grandes  para  diversos  articulos 
comprados  el  mismo  dia.  Una  lista  parcial  de  los  articulos 
y  sus  precios  se  dan  en  la  tabla  siguiente. 


Tiendas 


Articulos 

WinCo 

Albert¬ 

sons 

Ralphs 

Stater 

Bros 

Food-4- 

Less 

Ensalada  surtida, 

1  lb  bolsa 

0.88 

1.99 

1.79 

1.89 

0.98 

Hillshire  Farm®  Salchicha 
ahumada,  1 6  onza 

2.48 

4.29 

2.50 

3.00 

3.68 

Kellogg's  Raisin  Bran® 

25.5  onza 

2.48 

4.99 

4.69 

3.49 

3.38 

Kraft®  Philadelphia® 

Queso  crema,  8  onza 

1.18 

1.50 

1.99 

1.89 

1.97 

Kraft®  Ranch  Aderezo, 

16  onza 

1.58 

3.89 

2.69 

2.50 

1.68 

Langers®  Apple  Juice, 

128  onza 

1.98 

4.99 

4.59 

3.79 

2.98 

Dial®  Pastilla  jabon,  Gold, 
8-4.5  onza 

3.48 

5.79 

4.19 

3.99 

4.58 

Jif®  Mantequilla  de 

2.58 

4.89 

3.99 

3.89 

2.68 

cacahuate,  Cremosa, 

28  onza 

a.  ^Cuales  son  los  bloques  y  tratamientos  en  este 
experimento? 

b.  ^Los  datos  dan  evidencia  para  indicar  que  hay 
diferencias  significativas  en  precios  de  una  tienda  a 
otra?  Apoye  su  respuesta  estadisticamente  usando 
la  salida  impresa  ANOVA  que  sigue. 

c.  <j,Hay  diferencias  significativas  de  un  bloque  a  otro? 
^Era  efectivo  el  bloqueo? 

d.  El  anuncio  incluye  la  siguiente  frase:  “Aun  cuando 
esta  lista  no  pretende  representa  una  orden  tipica  de 
compras  semanales  o  una  lista  aleatoria  de  articulos, 
WinCo  continua  siendo  el  lider  en  precios  bajos  en  la 
zona”.  7,  Como  podria  esta  frase  afectar  la  confiabilidad 
de  sus  conclusiones  en  el  inciso  b)? 


ANOVA  en  dos  vias:  precio  contra  articulo,  tienda 


Source 

DF 

SS  MS 

F 

P 

Item 

7 

38.2360  5.46228 

19.39 

0 . 000 

Store 

4 

16.6644  4.16610 

14 . 79 

0 . 000 

Error 

28 

7.8862  0.28165 

Total 

39 

62 . 7866 

S  =  0. 

5307 

R-Sq  =  87.44%  R-Sq(adj)  = 

82.51% 
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1 1 .44  Compras  en  tiendas  grandes, 
continua  Consulte  el  ejercicio  1 1.43.  La  salida 
impresa  que  sigue  da  el  promedio  de  costos  de  los 
artfculos  seleccionados  para  las  k  =  5  tiendas. 


Store 


Mean 


Albertsons 
Food-4-Less 
Ralphs 
Stater  Bros 
WinCo 


4 . 04125 
2 . 74125 
3.30375 
3 . 05500 
2 . 08000 


a.  7,  Cual  es  el  valor  apropiado  de  q,os(k,  df)  para  probar 

diferencias  entre  tiendas?  _ 

b.  7,  Cual  es  el  valor  de  a>  =  qUs(k,  df)  ? 

c.  Use  la  prueba  de  comparacion  por  pares  de  Tukey 
entre  tiendas  usada  para  determinar  cuales  tiendas 
difieren  significativamente  en  promedio  de  precios  de 
los  artfculos  seleccionados. 


EL  EXPERIMENTO  FACTORIAL  a  x  b: 
UNA  CLASIFICACION  EN  DOS  VIAS 


Suponga  que  el  gerente  de  una  planta  manufacturera  sospecha  que  la  produccion  (en 
mi  mem  de  unidades  producidas  por  turno)  de  una  linea  de  produccion  depende  de  dos 
factores: 


•  Cual  de  dos  supervisores  esta  a  cargo  en  la  lfnea 

•  Cual  de  tres  turnos,  diurno,  vespertino  o  nocturno,  se  esta  midiendo 


Esto  es,  el  gerente  esta  interesado  en  dos  factores :  “supervisor”  a  dos  niveles  y  “turno” 
a  tres  niveles.  £ Puede  usted  usar  un  diseno  de  bloque  aleatorizado,  disenando  uno  de 
los  dos  factores  como  factor  de  bloque?  Para  hacer  esto,  necesitarfa  suponer  que  el 
efecto  de  los  dos  supervisores  es  el  mismo,  cualquiera  que  sea  el  turno  que  considere. 
Este  puede  no  ser  el  caso;  quiza  el  primer  supervisor  es  mas  eficiente  en  la  manana  y  el 
segundo  lo  es  en  el  turno  de  la  noche.  No  se  puede  generalizar  y  decir  que  un  supervisor 
es  mejor  que  el  otro  o  que  la  produccion  de  un  turno  particular  es  mejor.  Es  necesa- 
rio  investigar  no  solo  el  promedio  de  produccion  para  los  dos  supervisores  y  el  promedio 
de  produccion  para  los  tres  turnos,  sino  tambien  la  interaccion  o  relation  entre  los  dos 
factores.  Considere  dos  ejemplos  diferentes  que  muestran  el  efecto  de  interaccion  en  las 
respuestas  en  esta  situation. 

Suponga  que  los  dos  supervisores  son  observados  en  tres  dfas  seleccionados  al  azar  para 
cada  uno  de  los  tres  turnos  diferentes.  El  promedio  de  producciones  para  los  tres  turnos 
se  muestra  en  la  tabla  11.4  para  cada  uno  de  los  supervisores.  Vea  la  relation  entre 
los  dos  factores  en  la  grafica  de  lfneas  para  estas  medias,  mostrada  en  la  figura  11.11. 
Observe  que  el  supervisor  2  siempre  produce  mas,  cualquiera  que  sea  el  turno.  Los  dos 
factores  se  comportan  independientemente\  esto  es,  la  produccion  es  siempre  de  unas 
100  piezas  mas  para  el  supervisor  2,  no  importa  cual  turno  se  vea. 


TABLA  11.4  Promedio  de  produccion  para  dos  supervisores  en  tres  turnos 

Turno 

Nivel  deuso  Dia  Vespertino  Noche 

1  487  498  550 

2  602  602  637 
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FIGURA  11.11 

Grafica  de  interaccion  para 
medias  en  la  tabla  11.4 


Interaction  Plot  (data  means)  for  Response 


Supervisor 


1 

2 


Ahora  considere  otro  conjunto  de  datos  para  la  misma  situation,  mostrado  en  la  tabla 
1 1.5.  Hay  una  diferencia  definida  en  los  resultados,  dependiendo  de  cual  turno  se  vea,  y 
la  interaccion  se  puede  ver  en  las  lineas  cruzadas  de  la  grafica  de  la  figura  1 1.12. 


TABLA  11.5 


Promedio  de  production  para  dos  supervisores  en  tres  turnos 

Turno 

Nivel  deuso  Dia  Vespertino  Noche 


602  498 
487  602 


450 

657 


FIGURA  11.12 

Grafica  de  interaccion  para 
medias  en  la  tabla  11.5 


Interaction  Plot  (data  means)  for  Response 


Supervisor 


1 

2 
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CONSEJO 

Cuando  cambia  el  efecto  de 
un  factor  sobre  la  respuesta, 
dependiendo  del  nivel  al 
cual  se  mide  el  otro  factor, 
se  dice  que  los  dos  factores 
interact!]  an 


Esta  situation  es  un  ejemplo  de  un  experimento  factorial  en  el  que  hay  un  total  de 
2X3  posibles  combinaciones  de  los  niveles  para  los  dos  factores.  Estas  2X3=6 
combinaciones  forman  los  tratamientos  y  el  experimento  se  denomina  experimento 
factorial  de  2  X  3.  Este  tipo  de  experimento  en  realidad  se  puede  usar  para  investigar 
los  efectos  de  tres  o  mas  factores  en  una  respuesta  y  explorar  las  interacciones  entre  los 
factores.  No  obstante,  confinamos  nuestra  discusion  a  dos  factores  y  su  interaction. 

Cuando  se  comparen  medias  de  tratamiento  para  un  experimento  factorial  (o  para 
cualquier  otro  experimento),  sera  necesaria  mas  de  una  observation  por  tratamiento. 
Por  ejemplo,  si  el  experimentador  obtiene  dos  observaciones  para  cada  una  de  las  com¬ 
binaciones  de  factor  de  un  experimento  factorial  completo,  tiene  dos  replicas  del 
experimento.  En  la  siguiente  section  sobre  el  analisis  de  varianza  para  un  experimento 
factorial,  se  puede  suponer  que  cada  tratamiento  o  combination  de  niveles  de  factor  se 
replica  el  mismo  numero  de  veces  r. 


EL  ANALISIS  DE  VARIANZA 
PARA  UN  EXPERIMENTO 
FACTORIAL  a  x  b 

Un  analisis  de  varianza  para  un  experimento  factorial  de  dos  factores  replicado  r  veces 
sigue  el  mismo  patron  que  los  disenos  previos.  Si  las  letras  A  y  B  se  usan  para  identibcar 
los  dos  factores,  la  variation  total  en  el  experimento 


SS  Total  =  S(jc  -  3c)2  =  2x2  -  CM 


se  divide  en  cuatro  partes  de  modo  que 

SS  Total  =  SSA  +  SSB  +  SS(AB)  +  SSE 


donde 

•  SSA  (suma  de  cuadrados  para  el  factor  A)  mide  la  variation  entre  medias  del 
factor  A. 

•  SSB  (suma  de  cuadrados  para  el  factor  B)  mide  la  variation  entre  medias  del 
factor  B. 

•  SS(AB)  (suma  de  cuadrados  para  interaction)  mide  la  variation  entre  las  diferen- 
tes  combinaciones  de  niveles  de  factor. 

•  SSE  (suma  de  cuadrados  de  error)  mide  la  variation  de  las  diferencias  entre  las 
observaciones  dentro  de  cada  combination  de  niveles  de  factor,  es  decir,  el  error 
experimental. 

Es  frecuente  que  las  sumas  de  cuadrados  SSA  y  SSB  reciban  el  nombre  de  sumas  de 
cuadrados  de  efecto  principal,  para  distinguirlos  de  la  suma  de  cuadrados  de  interac- 
cion.  Aunque  se  puede  simpliricar  el  trabajo  si  se  usa  un  programa  de  computadora  para 
calcular  estas  sumas  de  cuadrados,  las  formulas  de  calculo  se  dan  a  continuation.  Se 
puede  suponer  que  son: 

•  a  niveles  del  factor  A 

•  b  niveles  del  factor  B 

•  r  replicas  de  cada  una  de  las  ab  combinaciones  de  factor 

•  Un  total  de  n  =  abr  observaciones 
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CALCULO  DE  LAS  SUMAS  DE  CUADRADOS  PARA 
UN  EXPERIMENTO  FACTORIAL  DE  DOS  FACTORES 

CM  =  ~  SS  Total  =  2x2  -  CM 

A2  B 2 

SSA  =  2tt  “  CM  SSB  =  X—  -  CM 


SS(AB)  =  X—r1  ~CM  -  SSA  -  SSB 
donde 

G  =  Suma  de  todas  las  n  =  abr  observaciones 

Aj  =  Total  de  todas  las  observaciones  al  z-esimo  nivel  del  factor  A, 
i  =  1,2,  a 

Bj  =  Total  de  todas  las  observaciones  al  /-esimo  nivel  del  factor  B, 

j  =  1,2,  b 

(AB),;  =  Total  de  las  r  observaciones  al  z-esimo  nivel  del  factor  A  y  el  /-esimo 
nivel  del  factor  B 


Cada  una  de  las  cinco  fuentes  de  variacion,  cuando  se  dividen  entre  los  grados  de 
libertad  apropiados,  da  una  estimacion  de  la  variacion  en  el  experimento.  Estas  esti- 
maciones  se  denominan  cuadraticos  medios,  MS  =  SS/cIf.  y  se  muestran  junto  con  sus 
respectivas  sumas  de  cuadrados  y  dfen  la  tabla  de  analisis  de  varianza  (o  ANOVA). 


TABLA  ANOVA  PARA  r  REPLICAS  DE  UN 
EXPERIMENTO  FACTORIAL  DE  DOS 
FACTORES:  FACTOR  A  A  NIVELES  a 
Y  FACTOR  B  A  NIVELES  b 


Fuente 

df 

SS 

MS 

A 

a  —  1 

SSA 

MSA=i^ 
a  —1 

B 

6-1 

SSB 

MSB  -  ,SSB. 
b  —  1 

AB 

(a- 11(6-1) 

SS(AB) 

SS(AB) 

MS(AB)  - 

(3-1)16-1) 

Error 

ab(r—  1) 

SSE 

MSE  =  SSE 
ab(r—  1) 

F 


MSA 

MSE 

MSB 

MSE 

MS(AB) 

MSE 


Total  abr—  1  SS  Total 


Finalmente,  la  igualdad  de  medias  para  varios  niveles  de  las  combinaciones  de  fac¬ 
tor  (el  efecto  de  interaccion)  y  para  los  niveles  de  ambos  efectos  principales,  A  y  B,  se 
puede  probar  usando  las  pruebas  F  de  ANOVA,  como  se  ve  a  continuacion. 
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E  J  E  M  P  L 


PRUEBAS  PARA  UN  EXPERIMENTO  FACTORIAL 

•  Para  interaction: 

1 .  Hipotesis  nula:  H0 :  Los  factores  A  y  B  no  interactuan 

2.  Hipotesis  alternativa:  Hd :  Los  factores  A  y  B  interactuan 

3.  Prueba  estadfstica:  F  =  MS((AB)/MSE.  donde  F  esta  basada  en  df  =  (a  —  1) 

(b  -  l)ydf2  =  ab(r  -  1) 

4.  Region  de  rechazo:  rechazar  H0  cuando  F  >  Fm  donde  Fa  esta  en  la  cola  superior 
de  la  distribution  F  (vease  la  figura),  o  cuando  el  valor  p  <  a 

•  Para  efectos  principals,  factor  A: 

1 .  Hipotesis  nula:  H0 :  No  hay  diferencias  entre  las  medias  del  factor  A 

2.  Hipotesis  alternativa:  Ha :  A1  menos  dos  de  las  medias  del  factor  A  difieren 

3.  Prueba  estadfstica:  F  =  MSA/MSE,  donde  F  esta  basada  en  df  =  (a  —  1)  y 
df2  =  ab(r  -  1) 

4.  Region  de  rechazo:  rechazar  H0  cuando  F  >  Fa  (vease  la  figura),  o  cuando  el 
valor  p  <  a 

•  Para  efectos  principals,  factor  B: 

1 .  Hipotesis  nula:  H0 :  No  hay  diferencias  entre  las  medias  del  factor  B 

2.  Hipotesis  alternativa:  Hd :  A1  menos  dos  de  las  medias  del  factor  B  difieren 

3.  Prueba  estadfstica:  F  =  MSB/MSE,  donde  F  esta  basada  en  dfx  =  (b  —  1)  y 
df2  =  ab(r  -  1) 

4.  Region  de  rechazo:  rechazar  H0  cuando  F  >  Fa  (vease  la  figura),  o  cuando  el 
valor  p  <  a 


La  tabla  1 1.6  muestra  los  datos  originales  empleados  para  general-  la  tabla  1 1.5  del  ejem- 
plo  11.11.  Esto  es,  los  dos  supervisores  fueron  observados  en  tres  dfas  seleccionados  al 
azar  para  cada  uno  de  los  tres  turnos  diferentes,  registrandose  las  salidas  de  production. 
Analice  estos  datos  usando  el  procedimiento  apropiado  de  analisis  de  varianza. 
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TABLA  11.6  Producciones  para  dos  supervisores  en  tres  turnos 


Turno 


Supervisor 

Diurno 

Vespertino 

Nocturno 

1 

571 

480 

470 

BIO 

474 

430 

625 

540 

450 

2 

480 

625 

630 

516 

600 

680 

465 

581 

661 

Solucion  La  salida  impresa  de  computadora  de  la  figura  11.13  fue  generada  usando 
el  procedimiento  de  dos  vfas  de  analisis  de  varianza  del  paquete  de  software  MINITAB.  Se 
pueden  verificar  las  cantidades  de  la  tabla  ANOVA  usando  las  formulas  de  calculo  pre- 
sentadas  antes  o  se  puede  escoger  solo  usar  los  resultados  e  inteipretar  su  significado. 


FIGURA  11.13 

Salida  impresa  MINITAB 
para  el  ejemplo  11.12 


ANOVA  de  dos  vias:  produccion  contra  supervisor,  turno 


Source  DF 
Supervisor  1 
Shift  2 
Interaction  2 
Error  12 
Total  17 


SS  MS 

19208  19208.0 

247  123.5 

81127  40563.5 

8640  720.0 

109222 


F 

26 .68 
0 . 17 
56.34 


P 

0 . 000 
0 . 844 
0 . 000 


S  =  26.83  R-Sq  =  92.09%  R-Sq(adj)  =  88.79% 


Supervisor 

1 

2 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 

Mean  - + - + - + - + - 

516.667  ( - * - ) 

582.000  ( - * - ) 

510  540  570  600 


Individual  95%  CIs  For  Mean  Based  on 


Pooled  StDev 

Shift  Mean  - + - + - + - + - 

Day  544.5  ( - * - ) 

Swing  550.0  ( - * - ) 

Night  553.5  ( - * - ) 


525  540  555  570 


CONSEJO 


Si  la  interaccion  no  es 
significativa,  pruebe 
cada  uno  de  los  factores 
individualmente. 


En  este  punto,  es  indudable  que  usted  haya  descubierto  el  patron  conocido  para  probar 
la  significancia  de  los  diversos  factores  experimentales  con  la  estadfstica  F  y  su  valor 
p.  El  valor  p  pequeno  (P  =  .000)  en  el  renglon  marcada  “Supervisor”  significa  que  hay 
suficiente  evidencia  para  declarar  una  diferencia  en  los  niveles  medios  para  el  factor  A, 
es  decir,  una  diferencia  en  producciones  medias  por  supervisor.  Este  hecho  es  visual- 
mente  aparente  en  los  intervalos  de  confianza  que  no  se  traslapan  para  las  medias  del 
supervisor  que  se  ven  en  la  salida  impresa.  Pero  esto  es  dominado  por  el  hecho  de  que 
hay  una  fuerte  evidencia  (P  =  .000)  de  una  interaccion  entre  los  factores  A  y  B.  Esto 
significa  que  el  promedio  de  produccion  para  un  turno  determinado  depende  del  super¬ 
visor  en  servicio.  Se  vio  claramente  este  efecto  en  la  figura  11.11.  Las  tres  producciones 
medias  mas  grandes  ocurren  cuando  el  supervisor  1  esta  en  el  turno  de  dfa  y  cuando  el 
supervisor  2  esta  ya  sea  en  el  turno  vespertino  o  nocturno.  Como  resultado  practico, 
el  gerente  debe  programar  al  supervisor  1  para  el  turno  de  dfa  y  al  supervisor  2  para  el 
turno  de  noche. 
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Si  el  efecto  de  interaccion  es  significativo,  las  diferencias  en  las  medias  de  tratamiento 
se  pueden  estudiar  mas,  no  comparando  las  medias  para  los  factores  A  o  B  individual- 
mente  sino  mas  bien  viendo  las  comparaciones  para  las  combinaciones  de  factor  de  nivel 
de  2  X  3  (AB).  Si  el  efecto  de  interaccion  no  es  significativo,  entonces  la  significance  de 
las  medias  de  efecto  principal  debe  investigate,  primero  con  la  prueba  F  general  y  lue- 
go  con  el  metodo  de  Tukey  para  comparaciones  apareadas  y/o  intervalos  de  confianza 
especfficos.  Recuerde  que  estos  analisis  de  procedimientos  de  varianza  siempre  usan 
s2  =  MSE  como  el  mejor  estimador  de  a2  con  grados  de  libertad  iguales  a  df  =  ab{r  —  1). 

Por  ejemplo,  usando  el  medidor  de  Tukey  para  comparar  el  promedio  de  produccio- 
nes  para  los  dos  supervisores  en  cada  uno  de  los  tres  turnos,  se  podrfa  calcular 

"  =  <7.05(6,  12)(^=)  =  4.75(^0)  =  73.59 

Como  los  tres  pares  de  medias  (602  y  487  en  el  turno  diurno,  498  y  602  en  el  turno  ves- 
pertino  y  450  y  657  en  el  tumo  nocturno)  difieren  en  mas  de  co,  nuestras  conclusiones 
practicas  han  sido  confirmadas  estadisticamente. 
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EJERCICIOS 


TECNICAS  BASICAS 

1 1 .45  Suponga  que  se  ha  de  realizar  un  experimento 
factorial  de  dos  factores,  el  factor  A  a  cuatro  niveles  y 
el  factor  B  a  cinco  niveles,  con  tres  replicas  por 
tratamiento. 

a.  /Cuantos  tratamientos  intervienen  en  el  experimento? 


son  Xi  =  8.3  yx2  =  6.3,  respectivamente.  Encuentre  un 
intervalo  de  confianza  de  95%  para  la  diferencia  entre  las 
dos  medias  poblacionales  correspondientes. 

datos  1 1 .48  La  tabla  siguiente  contiene  datos  para  un 
experimento  factorial  de  3  X  3,  con  dos  replicas 
por  tratamiento: 


b.  <'  Cuantas  observaciones  estan  involucradas? 

c.  Haga  una  lista  de  las  fuentes  de  variacion  y  sus 
respectivos  grados  de  libertad. 

1 1 .46  El  analisis  de  la  tabla  de  varianza  para  un 
experimento  factorial  de  3  X  4,  con  el  factor  A  en 
tres  niveles  y  el  factor  B  en  cuatro  niveles  y  con  dos 
observaciones  por  tratamiento,  se  muestra  a  continuacion: 

Fuente  df  SS  MS  F 

2  5.3 

3  9.1 

6 

12  24.5 

Total  23  43.7 

a.  Llene  los  renglones  faltantes  de  la  tabla. 

b.  i Los  datos  dan  suficiente  evidencia  para  indicar 
que  los  factores  A  y  B  interactuan?  Pruebe  usando 
a  =  .05.  ^Cuttles  son  las  implicaciones  practicas 
de  su  respuesta? 

c.  i Los  datos  dan  suficiente  evidencia  para  indicar 
que  los  factores  A  y  B  afectan  la  variable  x  de  la 
respuesta?  Explique. 

1 1 .47  Consulte  el  ejercicio  11.46.  Las  medias  de  dos  de 
las  combinaciones  a  nivel  de  factor,  es  decir  A  [  B  [  y  A2B2, 


Niveles  del  factor  A 


Niveles  del  factor  B 

1 

2 

3 

1 

5,  7 

9,  7 

4,  6 

2 

8,  7 

12, 13 

7, 10 

3 

14, 11 

8,  9 

12, 15 

a.  Efectue  un  analisis  de  varianza  para  los  datos  y 
presente  los  resultados  en  una  tabla  de  analisis  de 
varianza. 

b.  (',A  que  nos  referimos  cuando  decimos  que  los  factores 
A  y  B  interactuan? 

c.  (',Los  datos  dan  suficiente  evidencia  para  indicar 
interaccion  entre  los  factores  A  y  B?  Pruebe  usando 
a  =  .05. 

d.  Encuentre  el  valor  p  aproximado  para  la  prueba  del 
inciso  c). 

e.  Cu ales  son  las  implicaciones  practicas  de  sus 
resultados  en  el  inciso  c)?  Explique  sus  resultados 
usando  una  grafica  de  lfnea  similar  a  la  de  la  figura 
11.11. 

datos  1 1 .49  Factorial  de  2  X  2  La  tabla  contiene 
datos  para  un  experimento  factorial  de  2  X  2, 

con  cuatro  replicas  por  tratamiento. 
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Niveles  del  factor  A 

Niveles  del  factor  B  1  2 

1  2.1,  2.7,  3.7,  3.2, 

2.4,  2.5  3.0,  3.5 

2  3.1, 3.6,  2.9,27, 

3.4,  3.9  2.2,  2.5 

a.  La  grafica  siguiente  fue  generada  por  el  MINITAB. 
Verifique  que  los  cuatro  puntos  que  enlazan  las  dos 
rectas  sean  las  medias  de  cuatro  observaciones  dentro 
de  cada  combinacion  del  nivel  de  factor.  (\Quc  dice 
la  grafica  acerca  de  la  interaccion  entre  los  factores 
A  y  B? 


Grafica  de  interaccion  MINITAB  para  el  ejercicio  11.49 


b.  Use  la  salida  impresa  MINITAB  para  probar  una 
interaccion  significativa  entre  A  y  B.  (;Esto  confirma 
sus  conclusiones  del  inciso  a)? 

Salida  impresa  MINITAB  para  el  ejercicio  11.49 

ANOVA  en  dos  vias:  respuesta  contra  factor  A,  factor  B 


Source 

DF 

SS 

MS 

F 

P 

Factor  A 

1 

0 . 0000 

0 . 00000 

0 . 00 

1.000 

Factor  B 

1 

0 . 0900 

0 . 09000 

1 . 00 

0.338 

Interaction 

1 

3.4225 

3.42250 

37 . 85 

0 . 000 

Error 

12 

1.0850 

0 . 09042 

Total 

15 

4.5975 

S  =  0.3007 

R-Sq 

=  76.40% 

R-Sq (adj ) 

=  70.50% 

c.  Considerando  sus  resultados  en  el  inciso  b),  (:c6mo 
puede  explicar  el  hecho  de  que  ninguno  de  los  efectos 
principales  sea  significativo? 

d.  Si  se  encuentra  una  interaccion  significativa,  ;  es 
necesario  probar  por  diferencias  significativas  del 
efecto  principal?  Explique. 

e.  Escriba  un  parrafo  breve  que  resuma  los  resultados  de 
este  experimento. 


APLICACIONES 


(fjjfly  DATOS 
EX1 1 50 


11.50  Demanda  de  diamantes  Una 

cadena  de  joyerfas  realizo  un  experimento  para 


investigar  el  efecto  de  precio  y  lugar  sobre  la  demanda 
de  sus  diamantes.  Seis  joyerfas  de  ciudades  pequenas 
se  seleccionaron  para  el  estudio,  asf  como  otras  seis 
ubicadas  en  grandes  centros  comerciales  suburbanos. 
Dos  joyerfas  de  cada  uno  de  estos  lugares  se  asignaron  a 
cada  uno  de  tres  porcentajes  de  incremento  de  precio.  El 
porcentaje  de  ganancia  (o  perdida)  en  ventas  para  cada 
tienda  se  registro  al  termino  de  un  mes.  Los  datos  se 
muestran  en  la  tabla  siguiente. 


Incremento 


Lugar 

1 

2 

3 

Ciudad  pequena 

10 

-3 

-10 

4 

7 

-24 

Centro  comercial  suburbano 

14 

8 

-4 

18 

3 

3 

a.  7,  Los  datos  dan  suficiente  evidencia  para  indicar  una 
interaccion  entre  incremento  y  lugar?  Pruebe  usando 
a  =  .05. 

b.  Cu ales  son  las  implicaciones  practicas  de  su  prueba 
en  el  inciso  a)? 

c.  (',T race  una  grafica  de  rectas  semejante  a  la  de  la  figura 
11.11  para  ayudar  a  visualizar  los  resultados  de  este 
experimento.  Resuma  los  resultados. 

d.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  cambio  medio  en  ventas,  para  tiendas  en 
ciudades  pequenas  contra  las  de  centros  comerciales 
suburbanos,  si  las  tiendas  estan  usando  el  incremento 
de  precios  3. 

1 1 .51  Visualization  del  terreno  Se  realizo  un 
estudio  para  determinar  el  efecto  de  dos  factores  sobre 
el  entrenamiento  de  visualizacion  del  terreno  para 
soldados.4  Durante  los  programas  de  entrenamiento, 
los  participantes  vieron  mapas  de  contorno  de  varios 
terrenos  y  luego  se  les  permitio  ver  una  reconstruccion 
computarizada  del  terreno  como  se  verfa  desde  un 
angulo  especificado.  Los  dos  factores  investigados  en  el 
experimento  fueron  los  conocimientos  de  espacio  de 
los  participantes  (para  visualizar  en  tres  dimensiones) 
y  los  procedimientos  de  visualizacion  (activos  o  pasivos). 
La  participacion  activa  permitio  a  participantes  ver  las 
reconstrucciones  del  terreno,  generadas  por  computadora, 
desde  cualquiera  y  de  todos  los  angulos.  La  participacion 
pasiva  dio  a  los  participantes  un  conjunto  de 
reconstrucciones  del  terreno  previamente  seleccionadas. 
Los  participantes  fueron  examinados  de  acuerdo 
con  sus  conocimientos  del  espacio  y  de  las 
calificaciones  del  examen  20  fueron  clasificados  como 
poseedores  de  altos  conocimientos  del  espacio,  20 
regulares  y  20  bajos.  A  continuation,  10  participantes 
dentro  de  cada  uno  de  estos  grupos  fueron  asignados 
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a  cada  uno  de  los  dos  modos  de  entrenamiento,  activo 
o  pasivo.  Las  tablas  siguientes  son  la  tabla  ANOVA 
calculada  por  los  investigadores  y  la  tabla  de  las  medias 
de  tratamiento. 


este  experimento?  Explique  sus  conclusiones  en  forma  de 
reporte. 

Salida  impresa  MINITAB  para  el  ejercicio  1 1 .52 

ANOVA  de  dos  vias:  costo  contra  ciudad,  distancia 


Fuente 

df 

MS 

Error 

df 

F 

P 

Source 

City 

Distance 

Interaction 

Error 

Total 

Efectos  principales: 

Condicion  de  entrenamiento 

1 

103.7009 

54 

3.66 

.0610 

Capacidad 

2 

760.5889 

54 

26.87 

.0005 

S  =  5.737 

Interaccion: 

Condicion  de  entrenamiento 
X  Capacidad 

2 

124.9905 

54 

4.42 

.0167 

Distance 

1 

Dentro  de  celdas 

54 

28.3015 

2 

3 

4 


DF  SS 

2  201.33  100 

3  1873.33  624 

6  303.67  50 

12  395.00  32 

23  2773.33 


MS  F  P 
.667  3.06  0.084 
.444  18.97  0.000 
.611  1.54  0.247 
.  917 


R-Sq  =  85.76%  R-Sq(adj)  =  72.70% 


Mean 

32 . 1667 

19 . 1667 
11 . 8333 

9 . 5000 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 

- + - + - + - +  . 

( — + - ) 

( — + — ) 

( - + — ) 

( — + — ) 


Condicion  de  entrenamiento 


Conocimientos  de  espacio 

Activa 

Pasiva 

Altos 

17.895 

9.508 

Medios 

5.031 

5.648 

Bajos 

1.728 

1.610 

Nota\  Calificacion  max  =  36. 


a.  Explique  como  llegaron  los  autores  a  los  grados  de 
libertad  indicados  en  la  tabla  ANOVA. 

b.  (:,Son  correctos  los  valores  FT 

c.  Interprete  los  resultados  de  la  prueba.  ^Cuales  son  las 
implicaciones  practicas? 

d.  Use  la  tabla  6  del  apendice  1  para  aproximar  los 
valores  p  para  las  estadfsticas  F  indicadas  en  la  tabla 
ANOVA. 

Fuente:  H.F.  Barsam  y  Z.M.  Simutis,  "Computer-Based  Graphics  for  Terrain  Visualization 

Training",  Human  Factors,  no.  26, 1984.  Copyright  1984  por  the  Human  Factors  Society,  Inc. 

Reproducido  con  permiso. 


,®)i  gatos  1 1 .52  I  costo  de  volar  En  un  intento  por 

determinar  que  factores  afectan  a  las  tarifas 
aereas,  un  investigador  registro  un  promedio  ponderado 
de  los  costos  por  milla,  para  dos  aeropuertos  en  cada 
una  de  tres  ciudades  importantes  de  Estados  Unidos,  para 
cada  una  de  cuatro  distancias  de  viaje  diferentes.5  Los 
resultados  se  indican  en  la  tabla. 


Distancia 

Ciudad 

New  York 

Houston 

Chicago 

<  300  millas 

40,48 

20,  26 

19,  40 

301-750  millas 

19,  26 

15, 17 

14,  24 

751-1500  millas 

10, 14 

10, 13 

9, 15 

>  1500  millas 

9, 10 

8, 11 

7, 12 

Use  la  salida  impresa  MINITAB  para  analizar  el 
experimento  con  el  metodo  apropiado.  Identifique 
los  dos  factores  e  investigue  cualquier  posible  efecto 
debido  a  la  interaccion  de  esos  factores  o  los  efectos 
principales.  (jCuales  son  las  implicaciones  practicas  de 


1b)datos  1 1-53  Calificaciones  de  examen  de  cuarto 
exi  1 53  grado  Una  junta  directiva  local  estaba 
interesada  en  comparar  calificaciones  de  examen  en  un 
examen  estandar  de  lectura  para  estudiantes  de  cuarto 
grado  en  su  distrito.  Seleccionaron  una  muestra  aleatoria 
de  cinco  hombres  y  cinco  mujeres,  estudiantes  de 
cuarto  grado  en  cada  una  de  cuatro  escuelas  elementales 
diferentes  del  distrito  y  registraron  las  calificaciones  del 
examen.  Los  resultados  se  presentan  en  la  tabla  siguiente. 
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Genero 

Escuela  1 

Escuela  2 

Escuela  3 

Escuela  4 

Hombre 

631 

642 

651 

350 

566 

710 

611 

565 

620 

649 

755 

543 

542 

596 

693 

509 

560 

660 

620 

494 

Mujer 

669 

722 

709 

505 

644 

769 

545 

498 

600 

723 

657 

474 

610 

649 

722 

470 

559 

766 

711 

463 

a.  (iQue  tipo  de  diseno  experimental  es  este?  ^Cuales  son 
las  unidades  experimentales?  ^Cuales  son  los  factores 
y  niveles  de  interes  para  la  junta  directiva? 

b.  Efectue  el  analisis  de  varianza  apropiado  para  este 
experimento. 

c.  (',Los  datos  indican  que  el  efecto  del  genero  en  el 
promedio  de  calificaciones  del  examen  es  diferente, 
dependiendo  de  la  escuela  del  estudiante?  Pruebe 
usando  la  hipotesis  apropiada  de  a  =  .05. 

d.  Grafique  el  promedio  de  calificaciones  usando  una 
grafica  de  interaccion.  /.Como  describirfa  usted  el 
efecto  del  genero  y  escuela  en  el  promedio  de  las 
calificaciones  del  examen? 

e.  (',Los  datos  indican  que  cualquiera  de  los  efectos 
principales  es  significativo?  Si  el  efecto  principal 
es  significativo,  use  el  metodo  de  Tukey  de 
comparaciones  apareadas  para  examinar  las 
diferencias  en  detalle.  Use  a  =  .01. 

1 1 .54  Capacitacion  gerencial  Se  realizo  un 
experimento  para  investigar  el  efecto  de  la  capacitacion 
gerencial  sobre  la  habilidad  de  los  supervisores  para 
tomar  decisiones  en  una  gran  compafua.  Se  seleccionaron 
16  supervisores  y  ocho  fueron  escogidos  al  azar  para 
recibir  capacitacion  administrativa.  Cuatro  supervisores 
capacitados  y  cuatro  no  capacitados  se  seleccionaron 
al  azar  para  funcionar  en  una  situacion  en  la  que  surgio 
un  problema  comun.  A  los  otros  ocho  supervisores  se 
les  presento  una  situacion  de  emergencia  en  la  que  los 
procedimientos  estandar  no  podfan  usarse.  La  respuesta 
fue  una  clasificacion  de  conducta  administrativa  para 


cada  supervisor,  evaluada  al  calificar  un  esquema 
disenado  por  el  experimentador. 

a.  (:,Cuales  son  las  unidades  experimentales  de  este 
experimento? 

b.  ('.Cuales  son  los  dos  factores  considerados  en  el 
experimento? 

c.  (',Cuales  son  los  niveles  de  cada  factor? 

d.  ('.Cuantos  tratamientos  hay  en  el  experimento? 

e.  /,Que  tipo  de  diseno  experimental  se  ha  empleado? 

datos  11.55  Capacitacion  gerencial,  continua 

Consulte  el  ejercicio  1 1.54.  Los  datos  para  este 
experimento  se  muestran  en  la  tabla. 


Capacitacion  (A) 


Situacion  (B) 

Capacitado 

No  capacitado 

Totales 

Standard 

85 

53 

519 

91 

49 

80 

38 

78 

45 

Emergencia 

76 

40 

473 

67 

52 

82 

46 

71 

39 

Totales 

630 

362 

992 

a.  Construya  la  tabla  ANOVA  para  este  experimento. 

b.  oHay  una  interaccion  significativa  entre  la  presencia  o 
ausencia  de  capacitacion  y  el  tipo  de  situacion  de  toma 
de  decisiones?  Pruebe  al  nivel  de  5%  de  significancia. 

c.  oLos  datos  indican  una  diferencia  significativa  en 
calificaciones  de  conducta  para  los  dos  tipos  de 
situaciones  al  nivel  de  significancia  de  5%? 

d.  ^Las  calificaciones  de  conducta  difieren 
significativamente  para  los  dos  tipos  de  categories 
de  capacitacion  al  nivel  de  significancia  de  5%? 

e.  Grafique  el  promedio  de  calificaciones  con  el  uso  de 
una  grafica  de  interaccion.  ^Como  describirfa  usted 
el  efecto  de  la  capacitacion  y  situacion  de  emergencia 
en  las  habilidades  de  toma  de  decisiones  de  los 
supervisores? 


REPASO  DE  LAS  SUPOSICIONES 
DEL  ANALISIS  DE  VARIANZA 


En  la  seccion  11.3,  usted  aprendio  que  las  suposiciones  y  procedimientos  de  prueba  para 
el  analisis  de  varianza  son  semej  antes  a  los  requeridos  para  las  pruebas  t  y  F  del  capitulo 
10,  es  decir,  que  las  observaciones  dentro  de  un  grupo  de  tratamiento  deben  estar  dis- 
tribuidas  normalmente  con  varianza  comun  er2.  Tambien  aprendio  que  los  procedimien¬ 
tos  del  analisis  de  varianza  son  mas  bien  robustos  cuando  los  tamanos  muestrales  son 
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iguales  y  los  datos  son  de  forma  de  montfculo.  Si  este  es  el  caso,  un  modo  de  proteger- 
se  de  conclusiones  imprecisas  es  que  dentro  de  lo  posible  se  trate  de  seleccionar  mues- 
tras  de  tamanos  iguales. 

Hay  algunas  formas  rapidas  y  sencillas  de  comprobar  los  datos  en  cuanto  a  violation 
de  suposiciones.  Primero  veamos  el  tipo  de  variable  de  respuesta  que  se  mida.  El  expe- 
rimentador  podrfa  de  inmediato  ver  un  problema  con  la  normalidad  o  con  la  suposicion 
de  varianza  comiin.  Puede  ser  que  no  sea  posible  medir  cucintitativamente  los  datos  que 
haya  recolectado.  Muchas  respuestas,  por  ejemplo  preferencias  de  productos,  se  pueden 
clasificar  solo  como  “A  es  mejor  que  B”  o  “C  es  la  menos  preferible”.  Los  datos  que 
sean  cualitativos  no  pueden  tener  una  distribucion  normal.  Si  la  variable  de  respuesta 
es  discreta  y  puede  tomar  solo  tres  valores,  es  decir  0,  1  o  2,  entonces  no  es  razonable 
suponer  que  la  variable  de  respuesta  este  normalmente  distribuida. 

Suponga  que  la  variable  de  respuesta  es  binomial,  es  decir,  la  proporcion  p  de  perso¬ 
nas  a  favor  de  un  tipo  particular  de  inversion.  Aun  cuando  los  datos  binomiales  pueden 
tener  aproximadamente  la  forma  de  montfculo  bajo  ciertas  condiciones,  violan  la  supo¬ 
sicion  de  igual  varianza.  La  varianza  de  una  proporcion  muestral  es 

2  _  M  _  P0_  -  P) 

<r  n  n 

de  modo  que  la  varianza  cambia  dependiendo  del  valor  de  p.  Cuando  cambian  las 
medias  de  tratamiento,  el  valor  de  p  cambia  y  tambien  cambia  la  varianza  a2.  Una  situa¬ 
tion  similar  ocurre  cuando  la  variable  de  respuesta  es  una  variable  aleatoria  de  Poisson, 
por  ejemplo  el  numero  de  accidentes  industrials  por  mes  en  una  planta  manufacturera. 
Como  la  varianza  de  una  variable  aleatoria  de  Poisson  es  or  =  pi,  la  varianza  cambia 
exactamente  como  cambia  la  media  de  tratamiento. 

Si  el  experimentador  no  puede  ver  algunas  violaciones  flagrantes  en  el  tipo  de  datos 
que  se  miden,  vea  el  rango  de  los  datos  dentro  de  cada  grupo  de  tratamiento.  Si  estos  ran- 
gos  son  casi  iguales,  entonces  es  probable  que  la  suposicion  de  varianza  comiin  sea  ra¬ 
zonable.  Para  ver  si  hay  normalidad,  se  puede  hacer  una  rapida  grafica  de  puntos  o  de 
tallo  y  hoja  para  un  grupo  particular  de  tratamiento.  Sin  embargo,  es  frecuente  que  no  se 
tengan  suficientes  mediciones  para  obtener  una  grafica  razonable. 

Si  el  experimentador  utiliza  un  programa  de  computo  para  analizar  su  experimento, 
hay  algunas  valiosas  herramientas  de  diagnostico  que  puede  usar.  Estos  procedimien- 
tos  son  demasiado  complicados  para  hacer  calculos  manualmente,  pero  son  faciles  de 
usar  cuando  la  computadora  hace  el  trabajo. 

Graficas  residuales 

En  el  analisis  de  varianza,  la  variacion  total  en  los  datos  se  divide  en  varias  partes, 
dependiendo  de  los  factores  identificados  como  importantes  para  el  investigador.  Una 
vez  que  los  efectos  de  estas  fuentes  de  variacion  hayan  sido  removidos,  la  variabilidad 
“sobrante”  en  cada  observacion  se  denomina  residual  para  ese  punto  de  datos.  Estos 
residuales  representan  error  experimental,  la  variabilidad  basica  en  el  experimento  y 
deben  tener  una  distribucion  aproximadamente  normal  con  una  media  de  0  y  la  misma 
variacion  para  cada  grupo  de  tratamiento.  Casi  todos  los  paquetes  de  computadora  dan 
opciones  para  graficar  estos  residuales: 

•  La  grafica  de  probabilidad  normal  de  residuales  es  aquella  que  grafica  los 
residuales  para  cada  observacion  contra  el  valor  esperado  de  ese  residual  si 
hubiera  venido  de  una  distribucion  normal.  Si  los  residuales  son  aproximada¬ 
mente  normales,  la  grafica  sera  muy  semejante  a  una  linea  recta,  con  pendiente 
hacia  arriba  a  la  derecha. 
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•  La  grafica  de  residuales  contra  ajuste  o  residuales  contra  variables  es  aquella 
que  grafica  los  residuales  contra  el  valor  esperado  de  esa  observation  usando  el 
diseno  experimental  que  hemos  empleado.  Si  no  se  han  violado  suposiciones  y 
no  hay  fuentes  “sobrantes”  de  variation  que  no  sean  el  error  experimental,  esta 
grafica  deberla  mostrar  una  dispersion  aleatoria  de  puntos  alrededor  de  la  “recta 
de  error  cero”  horizontal  para  cada  grupo  de  tratamiento,  con  aproximadamente 
la  misma  dispersion  vertical. 

Los  datos  del  ejemplo  1 1 .4,  que  se  refieren  a  los  intervalos  de  atencion  de  tres  grupos 
de  estudiantes  de  escuela  elemental,  fueron  analizados  usando  el  MINITAB.  Las  grafi- 
cas  de  la  figura  11.14,  generadas  por  MINITAB,  son  la  grafica  de  probabilidad  normal 
y  los  residuales  contra  la  grafica  de  ajuste  para  este  experimento.  Observe  la  forma  de 
ltnea  recta  de  la  grafica  de  probabilidad  normal,  que  indica  una  distribution  normal 
en  los  residuales.  En  la  otra  grafica,  los  residuales  estan  graficados  contra  los  valores 
esperados  estimados,  que  son  los  promedios  muestrales  para  cada  uno  de  los  tres  trata- 
mientos  en  el  diseno  completamente  aleatorizado.  La  dispersion  aleatoria  alrededor  de  la 
“recta  de  cero  error”  horizontal  y  la  dispersion  constante  indican  que  no  hay  violaciones 
en  la  suposicion  de  varianza  constante. 


FIGURA  11.14 

Graficas  MINITAB  de 
diagnostic  para  ei 
ejemplo  11.13 


Una  companta  planea  promover  un  nuevo  producto  usando  una  de  tres  campanas  publi- 
citarias.  Para  investigar  el  grado  de  reconocimiento  del  producto  a  partir  de  estas  tres 
campanas,  se  seleccionaron  15  zonas  de  mercado  y  cinco  se  asignaron  al  azar  a  cada 
plan  de  publicidad.  Al  terminar  las  campanas  de  publicidad,  se  seleccionaron  muestras 
aleatorias  de  400  adultos  en  cada  zona  y  se  registraron  las  proporciones  que  estaban 
familiarizadas  con  el  nuevo  producto,  como  en  la  tabla  1 1.7.  H an  sido  violadas  algunas 
de  las  suposiciones  del  analisis  de  varianza  en  este  experimento? 


Proporciones  de  reconocimiento  de  un  producto  para  tres  campanas 
tabla  11.7  publicitarias 

Campana  1  Campana  2  Campana  3 


.33 

.28 

.21 

.29 

.41 

.30 

.21 

.34 

.26 

.32 

.39 

.33 

.25 

.27 

.31 

Solution  El  experimento  esta  bosquejado  como  un  diseno  completamente  aleato¬ 
rizado,  pero  la  variable  de  respuesta  es  una  proportion  muestral  binomial.  Esto  indica 
que  la  normalidad  y  las  suposiciones  de  varianza  comun  podrtan  ser  invalidas.  Vea  la 
grafica  de  probabilidad  normal  de  los  residuales  y  la  grafica  de  residuales  contra  ajuste 
generada  como  option  en  el  analisis  MINITAB  de  procedimiento  de  varianza  y  que  se  ve 
en  la  figura  11.15.  La  forma  curva  de  la  grafica  de  probabilidad  normal  indica  que  los 
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residuales  no  tienen  una  distribution  normal.  En  la  grafica  de  residual  contra  ajuste, 
se  pueden  ver  tres  rectas  verticales  de  residuales,  uno  por  cada  una  de  las  tres  campa- 
nas  publicitarias.  Observe  que  dos  de  las  rectas  (campanas  1  y  3)  son  cercanas  y  tienen 
dispersion  similar,  pero  la  tercera  recta  (campana  2)  esta  mas  alejada  hacia  la  derecha,  lo 
cual  indica  una  proporcion  muestral  mas  grande  y  consecuentemente  una  varianza  mas 
grande  en  este  grupo.  Ambos  analisis  de  suposiciones  de  varianza  son  sospechosos  en 
este  experimento. 


FIGURA  11.15 

Graficas  MINITAB  de 
diagnostic  para  el 
ejemplo  11.14 


(;Que  se  puede  hacer  cuando  las  suposiciones  ANOVA  no  se  satisfacen?  La  suposi- 
cion  de  varianza  constante  a  veces  puede  corregirse  al  transformar  las  mediciones  de 
respuesta.  Esto  es,  en  lugar  de  usar  las  mediciones  originales,  se  pueden  usar  sus  raices 
cuadradas,  logaritmos  o  alguna  otra  funcion  de  la  respuesta.  Las  transformaciones  que 
tienden  a  estabilizar  la  varianza  de  la  respuesta  tambien  tienden  a  hacer  sus  distribucio- 
nes  casi  normales  en  mayor  medida. 

Cuando  no  se  pueda  hacer  nada  para  siquiera  aproximadamente  satisfacer  las  suposi¬ 
ciones  ANOVA  o  si  los  datos  son  clasificaciones,  se  den  usar  procedimientos  no  para- 
metricos  de  prueba  y  estimacion,  presentados  en  el  capitulo  15.  Hemos  mencionado 
estos  procedimientos  antes;  son  casi  tan  potentes  para  detectar  diferencias  de  tratamien- 
tos  como  las  pruebas  presentadas  en  este  capitulo  cuando  los  datos  estan  normalmente 
distribuidos.  Cuando  las  suposiciones  parametricas  ANOVA  se  violan,  las  pruebas  no 
parametricas  son  por  lo  general  mas  potentes. 


UN  BREVE  REPASO 

Presentamos  tres  disenos  experimentales  diferentes  en  este  capitulo,  cada  uno  de  los 
cuales  puede  ser  analizado  usando  el  procedimiento  de  analisis  de  varianza.  El  objetivo 
del  analisis  de  varianza  es  detectar  diferencias  en  las  respuestas  medias  para  unidades 
experimentales  que  han  recibido  diferentes  tratamientos,  es  decir,  combinaciones  dife¬ 
rentes  de  los  niveles  de  factor  experimental.  Una  vez  realizada  una  prueba  general  de 
las  diferencias,  la  naturaleza  de  estas  diferencias  (si  existe  alguna)  se  pueden  explorer 
usando  metodos  de  comparaciones  pareadas  y/o  procedimientos  de  estimacion  de  inter- 
valo. 

Los  tres  disenos  presentados  en  este  capitulo  representan  solo  una  breve  introduccion 
al  tema  de  analizar  experimentos  disenados.  Los  disenos  estan  disponibles  para  expe- 
rimentos  que  contienen  diversas  variables  de  diseno,  asi  como  mas  de  dos  factores  de 
tratamiento  y  otros  disenos  mas  complejos.  Recuerde  que  las  variables  de  diseno  son 
factores  cuyo  efecto  se  desea  controlar  y  por  tanto  eliminar  del  error  experimental,  en 
tanto  que  las  variables  de  tratamiento  son  factores  cuyo  efecto  se  desea  investigar.  Si 
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su  experimento  esta  disenado  en  forma  apropiada,  usted  podra  analizarlo  usando  el  ana- 
lisis  de  varianza.  Los  experimentos  en  los  que  los  niveles  de  una  variable  son  medidos 
experimentalmente  en  lugar  de  controlados  o  preseleccionados  antes  de  tiempo,  pueden 
ser  analizados  usando  analisis  de  regresion  lineal  o  multiple,  que  es  el  tema  de  los 
capltulos  12  y  13. 


REPASO  DEL  CAPITULO 


Coneeptos  y  formulas  clave 

I.  Diserios  experimentales 

1 .  Unidades  experimentales,  factores,  niveles,  trata- 
mientos,  variables  de  respuesta. 

2.  Suposiciones:  las  observaciones  dentro  de  cada 
grupo  de  tratamiento  deben  estar  normalmente 
distribuidas  con  una  varianza  comun  a2. 

3.  Clasificacion  en  una  direction,  diseno  completa- 
mente  aleatorizado:  las  muestras  aleatorias  inde- 
pendientes  se  seleccionan  de  entre  cada  una  de  las 
k  poblaciones. 

4.  Clasificacion  en  dos  direcciones;  diseno  de  bloque 
aleatorizado:  k  tratamientos  se  comparan  dentro 
de  b  grupos  relativamente  homogeneos  de 
unidades  experimentales  llamadas  bloques. 

5.  Clasificacion  en  dos  direcciones,  experimento 
factorial  a  X  b\  dos  factores,  A  y  B,  se  comparan 
a  varios  niveles.  Cada  combination  factor-nivel 
se  replica  r  veces  para  considerar  la  investigation 
de  una  interaccion  entre  los  dos  factores. 

II.  Analisis  de  varianza 

1 .  La  variacion  total  en  el  experimento  esta  dividida 
en  variacion  (sumas  de  cuadrados)  explicada  por 
los  diversos  factores  experimentales  y  variacion 
debida  a  error  experimental  (no  explicado). 

2.  Si  hay  un  efecto  debido  a  un  factor  particular,  su 
cuadratico  medio  (MS  =  SS Idf)  por  lo  general  es 
grande  y  F  =  MS(factor)/MSE  es  grande. 

3.  Las  estadlsticas  de  prueba  para  los  diversos 
factores  experimentales  estan  basadas  en  estadls- 
ticas  F,  con  grados  de  libertad  apropiados  (df2  = 
grados  de  libertad  de  error). 


III.  Interpretacion  de  un  analisis 

de  varianza 

1 .  Para  el  diseno  de  bloque  completamente  aleatori¬ 
zado  y  el  aleatorizado,  en  cada  factor  se  prueba  su 
significancia. 

2.  Para  el  experimento  factorial,  primero  pruebe 
para  interaccion  significativa.  Si  la  interaccion 
es  significativa,  no  es  necesario  probar  efectos 
principales.  La  naturaleza  de  las  diferencias  en 
las  combinaciones  factor-nivel  deben  examinarse 
mas. 

3.  Si  se  encuentra  una  diferencia  significativa  en 
las  medias  poblacionales,  el  metodo  de  Tukey  de 
comparaciones  por  pares  o  un  metodo  semejante 
se  pueden  usar  para  identificar  mas  la  naturaleza 
de  las  diferencias. 

4.  Si  el  experimentador  tiene  especial  interes  en 
una  media  poblacional  o  en  la  diferencia  entre  dos 
medias  poblacionales,  puede  usar  una  estimacion 
de  intervalo  de  confianza.  (Para  un  diseno  de  blo¬ 
que  aleatorizado,  los  intervalos  de  confianza  no 
dan  estimaciones  insesgadas  para  medias  pobla¬ 
cionales  individuales.) 

IV.  Verificacion  del  analisis 

de  suposiciones  de  varianza 

1 .  Para  verificar  la  normalidad,  use  la  grafica  de 
probabilidad  normal  para  los  residuales.  Los  resi- 
duales  deben  exhibir  una  forma  de  llnea  recta, 
creciendo  hacia  arriba  a  la  derecha. 

2.  Para  verificar  la  igualdad  de  varianza,  use  los  resi¬ 
duales  contra  una  grafica  de  ajuste.  La  grafica  debe 
exhibir  una  dispersion  aleatoria,  con  la  misma  dis¬ 
persion  vertical  alrededor  de  la  “llnea  de  error  cero” 
horizontal. 
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Procedimientos  de  analisis  de  varianza 


Los  procedimientos  estadfsticos  empleados  para  efectuar  el  analisis  de  varianza  para 
los  tres  disenos  experiment  ales  diferentes  en  este  capitulo  se  encuentran  en  un  subme¬ 
nu  MINITAB  al  seleccionar  Stat  — >  ANOYA.  El  usuario  vera  opciones  para  One-way, 
One-way  (Unstacked)  y  Two-way  que  van  a  generar  cuadros  de  dialogo  empleados 
para  disenos  completamente  aleatorizados,  de  bloque  aleatorizado  y  factoriales,  res- 
pectivamente.  Se  deben  guardar  correctamente  los  datos  y  luego  escoger  las  columnas 
correspondientes  a  los  factores  necesarios  en  el  experimento.  Mostraremos  algunos  de 
los  cuadros  de  dialogo  y  salidas  impresas  de  ventana  Session  para  los  ejemplos  de  este 
capitulo,  empezando  con  una  clasificacion  en  una  direccion,  el  estudio  completamen¬ 
te  aleatorizado  del  desayuno  del  ejemplo  1 1.4. 

Primero,  introduzca  los  15  intervalos  de  atencion  registrados  en  la  columna  Cl  de 
una  hoja  de  trabajo  MINITAB y  apliqueles  nombre  “Span”.  A  continuation,  introduzca  los 
enteros  1,  2  y  3  en  una  segunda  columna  C2  para  identificar  la  asignacion  de  alimento 
( tratamiento )  para  cada  observation.  El  usuario  puede  hacer  que  el  MINITAB  fije  esta 
forma  usando  Calc  — >  Make  Patterned  Data  — >  Simple  Set  of  Numbers  e  introdu- 
ciendo  los  numeros  apropiados,  como  se  ve  en  la  figura  11.16.  Entonces  use  Stat  — » 
ANOVA  — »  One-way  para  generar  el  cuadro  de  dialogo  de  la  figura  11.17.'  El  usuario 
debe  seleccionar  la  columna  de  observaciones  para  la  caja  “Response”  y  la  columna  de 
indicadores  de  tratamiento  para  el  cuadro  “Factor”.  Entonces  tendra  varias  opciones. 
Bajo  Comparisons,  puede  seleccionar  “Tukey’s  family  error  rate”  (que  tiene  un  nivel 
predeterminado  de  5%)  para  obtener  una  salida  de  comparaciones  apareadas.  Bajo  Gra¬ 
phs,  puede  seleccionar  graficas  de  valor  individual  y/o  graficas  de  caja  para  comparar 
las  tres  asignaciones  de  alimentos  y  puede  generar  graficas  residuales  (use  “Normal  plot 
of  residuals”  y/o  “Residuals  versus  fits”)  para  verificar  la  validez  de  las  suposiciones 
ANOVA.  De  un  clic  en  OK  desde  la  caja  de  dialogo  principal  para  obtener  la  salida 
impresa  de  la  figura  1 1.3  del  texto. 

El  comando  Stat  — »  ANOVA  —>  Two-way  se  puede  usar  para  los  disenos  de  bloque 
aleatorizado  y  factorial.  Primero  hay  que  introducir  todas  las  observaciones  en  una  sola 
columna  y  luego  enteros  o  nombres  descriptivos  para  indicar  cualquiera  de  estos  casos: 

•  El  bloque  y  tratamiento  para  cada  una  de  las  mediciones  en  un  diseno  de  bloque 
aleatorizado. 

•  Los  niveles  de  los  factores  Ay  B  para  el  experimento  factorial. 

MINITAB  reconocera  diversas  replicas  dentro  de  cada  combination  de  factor-nivel 
en  el  experimento  factorial  y  desglosara  la  suma  de  cuadrados  para  interaction  (mien- 
tras  el  usuario  no  ponga  marca  en  la  caja  “Fit  additive  model”).  Como  estos  dos  disenos 
contienen  la  misma  secuencia  de  comandos,  usaremos  los  datos  del  ejemplo  1 1.12  para 
generar  el  analisis  de  varianza  para  el  experimento  factorial.  Los  datos  estan  introduci- 
dos  en  la  hoja  de  trabajo  de  la  figura  11.18.  Vea  si  puede  usar  Calc  —>  Make  Patterned 
Data  — »  Simple  Set  of  Numbers  para  introducir  los  datos  en  las  columnas  C2-C3.  Una 
vez  introducidos  los  datos,  use  Stat  — »  ANOVA  — »  Two-way  para  generar  el  cuadro  de 
dialogo  de  la  figura  11.19.  Escoja  “Output”  para  la  caja  “Response”  y  “Supervisor”  y 
“Shift”  para  el  “Row  factor”  y  “Column  factor”,  respectivamente.  Puede  escoger  exhibit- 
las  medias  de  efecto  principal  junto  con  intervalos  de  confianza  de  95%  si  verifica  “Dis¬ 
play  means”  y  puede  seleccionar  graficas  residuales  si  lo  desea.  De  un  clic  en  OK  para 
obtener  una  salida  impresa  ANOVA  en  la  figura  11.13. 


f  Si  el  usuario  habia  introducido  cada  una  de  las  tres  muestras  en  columnas  separadas,  el  comando  apropiado 
hubiera  sido  Stat  — »  ANOVA  — »  One-way  (Unstacked). 
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FIGURA  11.16 


FIGURA  11.17 


One-Way  Analysis  of  Variance 


Response: 

Factor:  |  Meal 

r  Store  residuals 

I-  Store  fitc 

Confidence  level:  |  95.0 
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FIGURA  11.18 
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FIGURA  11.19 


Cl  Output 

C2  Supervisor 
C3  Shtft 

Response; 

|  Output 

Row  factor: 

|  Supervisor 

|v*  Display  means 

Column  factor; 

1  Shift 

17  Disploy  means 

r  Store  residuals 
f~  Stnrnfrs 

Confidence  level;  |  95.0 

r  Fit  add*rve  model  fjraptw.  .. 

Conccl 


OK 


Como  la  interaccion  entre  supervisores  y  turnos  es  altamente  significativa,  el  inves- 
tigador  puede  explorar  la  naturaleza  de  esta  interaccion  al  graficar  el  promedio  de  pro- 
duccion  para  cada  supervisor  en  cada  uno  de  los  tres  turnos.  Use  Stat  — »  ANOYA  —> 
Interactions  Plot  y  escoja  las  variables  apropiadas  de  respuesta  y  factor.  La  grafica  es 
generada  por  el  MINITAB  y  se  exhibe  en  la  figura  1 1 .20.  El  usuario  puede  ver  la  fuerte  di- 
ferencia  en  los  comportamientos  de  las  producciones  medias  para  los  dos  supervisores, 
lo  cual  indica  una  fuerte  interaccion  entre  los  dos  factores. 
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FIGURA  1  1  .20 


EJercicios  suplementarios 

(^Jdatos  11.56  Tiempos  de  reaccion  vs. 

estimulos  Veintisiete  personas  participaron 
en  un  experimento  para  comparar  los  efectos  de  cinco 
diferentes  estimulos  sobre  el  tiempo  de  reaccion.  El 
experimento  se  corrio  usando  un  diseno  completamente 
aleatorizado  y,  cualquiera  que  fuera  el  resultado  del 
analisis  de  varianza,  los  experimentadores  deseaban 
comparar  los  estimulos  A  y  D.  Los  resultados  del 
experimento  se  dan  aqui.  Use  la  salida  impresa  MINITAB 
para  completar  el  ejercicio. 


Salida  impresa  MINITAB  para  el  ejercicio  11.56 


Anova  en  una  via:  tiempo  contra  estimulo 

Source  DF  SS  MS  F  P 

Stimulus  4  1.2118  0.3030  11.67  0.000 

Error  22  0.5711  0.0260 

Total  26  1.7830 


S  =  0.1611  R-Sq  =  67.97%  R-Sq(adj)  =  62.14% 


A 


C 

D 

E 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 

Mean  StDev  - + - + - + - +  • 

0.6250  0.1258  ( - * - ) 

0.6714  0.1496  ( - * - ) 

1.0667  0.1966  ( - * - ) 

0.9200  0.1483  ( - * - ) 

0.4800  0.1643  ( - * - ) 


Pooled  StDev  =  0.1611 


0.50  0.75  1.00  1.25 


Estimulo  Tiempo  de  reaccion  (s)  Total  Media 


A 

.8 

.6 

.6 

.5 

2.5 

.625 

B 

.7 

.8 

.5 

.5 

.6  .9  .7 

4.7 

.671 

C 

1.2 

1.0 

.9 

1.2 

1.3  .8 

6.4 

1.067 

D 

1.0 

.9 

.9 

1.1 

.7 

4.6 

.920 

E 

.6 

.4 

.4 

.7 

.3 

2.4 

.480 

a.  Realice  un  analisis  de  varianza  y  pruebe  por  si  hay 
diferencia  en  los  tiempos  medios  de  reaccion  debido  a 
los  cinco  estimulos. 

b.  Compare  los  estimulos  A  y  D  para  ver  si  hay  una 
diferencia  en  tiempos  medios  de  reaccion. 
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1 1 .57  Consulte  el  ejercicio  1 1.56.  Use  esta  salida 
impresa  MINITAB  para  identibcar  las  diferencias  en  las 
medias  de  tratamiento. 

Salida  impresa  MINITAB  para  el  ejercicio  11.57 


Tukey  95%  Simultaneous  Confidence  Intervals 
All  Pairwise  Comparisons  among  Levels  of  Stimulus 

Individual  confidence  level  =  99.29% 

Stimulus  =  A  subtracted  from: 

Stimulus  Lower  Center  Upper 

B  -0.2535  0.0464  0.3463 

C  0.1328  0.4417  0.7505 

D  -0.0260  0.2950  0.6160 

E  -0.4660  -0.1450  0.1760 


Stimulus  =  B  subtracted  from: 

Stimulus  Lower  Center  Upper 
C  0.1290  0.3952  0.6615 
D  -0.0316  0.2486  0.5288 
E  -0.4716  -0.1914  0.0888 


Stimulus  =  C  subtracted  from: 

Stimulus  Lower  Center  Upper 
D  -0.4364  -0.1467  0.1431 
E  -0.8764  -0.5867  -0.2969 


Stimulus  =  D  subtracted  from: 

Stimulus  Lower  Center  Upper  - + - + - + - +  - 

E  -0.7426  -0.4400  -0.1374  ( - * - ) 


-0.50  0.00  0.50  1.00. 


1 1 .58  Consulte  el  ejercicio  1 1.56.  ^Que  dicen  la  grafica 
de  probabilidad  normal  y  la  grafica  de  residuales  contra 
ajuste  acerca  de  sus  resultados  del  analisis  de  varianza? 


Graficas  de  diagnostico  MINITAB  para  el  ejercicio  11.58 


( — * — ) 


( — * — j 
( — * — > 

( — * — ) 


-0.50  0.00  0.50  1.00 


( - * - ) 

( - * - ) 


( - * - ) 

-0.50  0.00  0.50  1.00 


( - * - ) 

( - * - ) 

-0.50  0.00  0.50  1.00 


(^)datos  1 1.59  Tiempos  de  reaccion  II  El 

experimento  del  ejercicio  1 1.56  podrfa  haberse 
realizado  en  forma  mas  efectiva  usando  un  diseno  de 
bloque  aleatorizado  con  personas  como  bloques,  porque 
se  esperarfa  que  el  tiempo  medio  de  reaccion  variarfa 
de  una  persona  a  otra.  En  consecuencia,  cuatro  personas 
se  emplearon  en  un  nuevo  experimento  y  cada  persona 
fue  sometida  a  cada  uno  de  los  cinco  estimulos  en  orden 
aleatorio.  Los  tiempos  de  reaccion  (en  segundos)  se 
indican  a  continuacion: 


Estimulo 


Persona 

A 

B 

C 

D 

E 

1 

.7 

.8 

1.0 

1.0 

.5 

2 

.6 

.6 

1.1 

1.0 

.6 

3 

.9 

1.0 

1.2 

1.1 

.6 

4 

.6 

.8 

.9 

1.0 

.4 

Salida  impresa  MINITAB  para  el  ejercicio  11.59 


ANOVA  de  dos  vi'as:  tiempo  contra  persona,  estimulo 


Source  DF 
Subject  3 
Stimulus  4 
Error  12 
Total  19 


SS  MS 
0.140  0.046667 
0.787  0.196750 
0.085  0.007083 
1.012 


F  P 

6.59  0.007 

27.78  0.000 


S  =  0.08416  R-Sq  =  91.60%  R-Sq(adj)  =  86.70% 

Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 

- + - + - + - +  - 

( — * — ) 

( — * — ) 

— > 

(---* — > 

<---* — i 

- 1 - . - + - 1-  - 

0.60  0.80  1.00  1.20 

a.  Use  la  salida  impresa  MINITAB  para  analizar  los 
datos  y  probar  si  hay  diferencias  en  medias  de 
tratamiento. 

b.  Use  el  metodo  de  Tukey  de  comparaciones  apareadas 
para  identibcar  las  diferencias  significativas  por  pares 
en  los  estimulos. 

c.  (:,Lc  parece  que  el  bloqueo  fue  ebcaz  en  este 
experimento? 

(^)datos  11.60  Frecuencia  cardiaca  y  ejercicio  Se 

realizo  un  experimento  para  examinar  el  efecto 
de  la  edad  en  la  frecuencia  cardiaca  cuando  una  persona 
esta  sometida  a  una  cantidad  especibcada  de  ejercicio. 
Diez  hombres  fueron  seleccionados  al  azar  de  entre 
cuatro  grupos  de  edad:  10-19,  20-39,  40-59  y  60-69. 
Cada  uno  de  ellos  camino  en  una  caminadora  a  un  grado 
bjo  durante  12  minutos,  registrandose  su  aumento  en 
frecuencia  cardiaca  (en  pulsaciones  por  minuto),  la 
diferencia  antes  y  despues  del  ejercicio: 


Stimulus  Mean 
A  0.700 
B  0.800 
C  1.050 
D  1.025 
E  0.525 
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10-19 

20-39 

40-59 

60-69 

29 

24 

37 

28 

33 

27 

25 

29 

26 

33 

22 

34 

27 

31 

33 

36 

39 

21 

28 

21 

35 

28 

26 

20 

33 

24 

30 

25 

29 

34 

34 

24 

36 

21 

27 

33 

22 

32 

33 

32 

Total 

309 

275 

295 

282 

Use  un  programa  apropiado  de  computadora  para 
contestar  estas  preguntas: 

a.  ('Uos  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  el  aumento  medio  en  frecuencia  cardiaca 
entre  los  cuatro  grupos  de  edad?  Pruebe  usando  a  =  .05. 

b.  Encuentre  un  intervalo  de  confianza  de  90%  para  la 
diferencia  en  el  aumento  medio  de  frecuencia  cardiaca 
entre  los  grupos  de  10-19  y  60-69. 

c.  Encuentre  un  intervalo  de  confianza  de  90%  para  el 
aumento  medio  en  frecuencia  cardiaca  para  el  grupo 
de  edad  de  20-39. 

d.  ^Aproximadamente  cuantas  personas  necesitarfa  en 
cada  grupo,  si  deseara  estimar  una  media  de  grupo 
correcta  a  no  mas  de  dos  pulsaciones  por  minuto  con 
probabilidad  igual  a  .95? 

(^)datos  11.61  Aprendiendo  a  vender  Una 

compafua  deseaba  estudiar  los  efectos  de  cuatro 
programas  de  capacitacion  en  habilidad  para  vender, 
en  su  personal  de  ventas.  Treinta  y  dos  personas  fueron 
divididas  al  azar  en  cuatro  grupos  de  igual  tamano  y 
cada  grupo  fue  sometido  a  uno  de  los  diferentes 
programas  de  capacitacion  en  ventas.  Debido  a  que  hubo 
algunas  deserciones  durante  los  programas  de  capacitacion 
debido  a  enfermedad,  vacaciones,  etc.,  el  numero  de 
estudiantes  que  completaron  los  programas  vario  de  un 
grupo  a  otro.  Al  termino  de  estos,  cada  vendedor  fue 
asignado  al  azar  a  un  area  de  ventas  de  un  grupo  de  areas 
de  ventas  que  fueron  consideradas  como  que  tenfan 
potenciales  equivalentes  de  ventas.  Las  ventas  hechas  por 
cada  uno  de  los  cuatro  grupos  de  vendedores  durante  la 
primera  semana,  despues  de  completar  el  programa  de 
capacitacion,  aparecen  en  la  tabla  siguiente: 


Programa  de  capacitacion 


1 

2 

3 

4 

78 

99 

74 

81 

84 

86 

87 

63 

86 

90 

80 

71 

92 

93 

83 

65 

69 

94 

78 

86 

73 

85 

79 

97 

73 

91 

70 

Total 

482 

735 

402 

588 

Analice  el  experimento  usando  el  metodo  apropiado. 
Identifique  los  tratamientos  o  factores  de  interes  para 
el  experimentador  e  investigue  cualesquier  efectos 
significativos.  /.Cuales  son  las  implicaciones  practicas  de 
este  experimento?  Escriba  un  parrafo  que  explique  los 
resultados  de  su  analisis. 

1 1 .62  Factorial  de  4  x  2  Supongamos  que  usted  ha 
de  realizar  un  experimento  factorial  de  dos  factores,  el 
factor  A  en  cuatro  niveles  y  el  factor  B  en  dos  niveles, 
con  r  replicas  por  tratamiento. 

a.  (■.Cuantos  tratamientos  intervienen  en  el  experimento? 

b.  ^Cuantas  observaciones  estan  involucradas? 

c.  Haga  una  lista  de  las  fuentes  de  variacion  y  sus  grados 
de  libertad  respectivos. 

1 1 .63  Factorial  de  2  x  3  El  analisis  de  una  tabla  de 
varianza  para  un  experimento  factorial  de  2  X  3,  factor 
A  en  dos  niveles  y  el  factor  B  en  tres  niveles,  con  cinco 
observaciones  por  tratamiento,  se  muestra  en  la  tabla. 

Fuente  df  SS  MS  F 

A  1.14 

B  2.58 

AB  .49 

Error 

Total  8.41 

a.  ('.Los  datos  dan  suficiente  evidencia  para  indicar  una 
interaction  entre  los  factores  A  y  B?  Pruebe  usando 
a  =  .05.  (',Cuales  son  las  implicaciones  practicas 

de  su  respuesta? 

b.  De  el  valor  p  aproximado  para  la  prueba  del  inciso  a). 

c.  (:,Los  datos  dan  suficiente  evidencia  para  indicar  que  el 
factor  A  afecta  la  respuesta?  Pruebe  usando  a  =  .05. 

d.  (:,Los  datos  dan  suficiente  evidencia  para  indicar  que  el 
factor  B  afecta  la  respuesta?  Pruebe  usando  a  =  .05. 

1 1 .64  Consulte  el  ejercicio  1 1.63.  Las  medias  de  todas 
las  observaciones,  a  los  niveles  At  y  A2  del  factor  A 
son  x,  =  3.7  y  x2  =  1.4,  respectivamente.  Encuentre  un 
intervalo  de  confianza  para  la  diferencia  en  respuesta 
media  para  los  niveles  de  factor  A!  y  A2. 

(^)oatos  11.65  La  mosca  blanca  en  California  La 

mosca  blanca,  que  produce  la  cafda  de  hojas 
de  arbustos  y  arboles  y  una  reduccion  en  production  de 
cosechas  negociables,  ha  emergido  como  plaga  en  el  sur 
de  California.  En  un  estudio  para  determinar  factores 
que  afectan  el  ciclo  vital  de  la  mosca  blanca,  se  realizo 
un  experimento  en  el  que  moscas  blancas  fueron  puestas 
en  dos  tipos  diferentes  de  plantas  a  tres  temperaturas 
diferentes.  La  observation  de  interes  fue  el  numero  total 
de  huevecillos  depositados  por  hembras  enjauladas  bajo 
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una  de  las  seis  posibles  combinaciones  de  tratamiento. 
Cada  combination  de  tratamiento  se  corrio  usando  cinco 
j  aulas. 

Temperatura 


Planta  Desechos  contaminantes  (Ib/gal  de  desechos) 


A 

1.65 

1.72 

1.50 

1.37 

1.60 

B 

1.70 

1.85 

1.46 

2.05 

1.80 

C 

1.40 

1.75 

1.38 

1.65 

1.55 

D 

2.10 

1.95 

1.65 

1.88 

2.00 

Planta 

70°F 

77°F 

82°F 

37 

34 

46 

21 

54 

32 

Algodon 

36 

40 

41 

43 

42 

36 

31 

16 

38 

50 

59 

43 

53 

53 

62 

Pepino 

25 

31 

71 

37 

69 

49 

48 

51 

59 

Salida  impresa  MINITAB  para  el  ejercicio  11.65 


ANOVA  en  dos  vias:  huevecillos  contra  planta,  temperatura 


Source 

DF 

SS 

MS 

F 

Plant 

1 

1512.30 

1512.30 

12.29 

Temperature 

2 

487.47 

243 .73 

1.98 

Interaction 

2 

111.20 

55.60 

0.45 

Error 

24 

2952.40 

123 . 02 

Total 

29 

5063.37 

S  =  11.09 

R-Sq  = 

41 . 69% 

R-Sq (adj ) 

=  29.54% 

a.  ^Que  tipo  de  diseno  experimental  se  ha  empleado? 

b.  c,Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  efecto  de  la  temperatura  en  el  numero  de  huevos 
depositados  es  diferente,  dependiendo  del  tipo  de 
planta?  Use  la  salida  impresa  MINITAB  para  probar  la 
hipotesis  apropiada. 

c.  Grafique  las  medias  de  tratamiento  para  algodon 
como  funcion  de  la  temperatura.  Grafique  las  medias 
de  tratamiento  para  pepino  como  funcion  de  la 
temperatura.  Comente  sobre  la  similitud  o  diferencia 
en  estas  dos  graficas. 

d.  Encuentre  el  numero  medio  de  huevos  depositados  en 
algodon  y  pepino  con  base  en  15  observaciones  cada 
uno.  Calcule  un  intervalo  de  confianza  de  95%  para  la 
diferencia  en  las  medias  poblacionales  que  sirven  de 
base. 

(^)datos  11.66  Contamination  proveniente  de 

plantas  quimicas  Cuatro  plantas  qufmicas, 
que  producen  el  mismo  producto  y  son  propiedad  de 
la  misma  compafha,  descargan  aguas  negras  en 
arroyos  de  la  cercanfa  de  sus  lugares.  Para  comprobar 
el  grado  de  contamination  creada  por  las  aguas  negras 
y  para  determinar  si  esto  varfa  de  una  planta  a  otra,  la 
compafha  recolecto  muestras  aleatorias  de  desechos 
lfquidos,  cinco  especfmenes  por  cada  una  de  las  cuatro 
plantas.  Los  datos  se  muestran  en  la  tabla: 


a.  <:,Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  las  cantidades  medias  de  aguas  negras 
descargadas  por  las  cuatro  plantas? 

b.  Si  la  descarga  media  maxima  de  aguas  negras  es 
1.5  lb/gal,  (Jos  datos  dan  suficiente  evidencia  para 
indicar  que  el  lfmite  esta  excedido  en  la  planta  A? 

c.  Estime  la  diferencia  en  la  descarga  media  de  aguas 
negras  entre  las  plantas  A  y  D,  usando  un  intervalo  de 
confianza  de  95%. 

((^)[jatos  11.67  Articulos  basicos  en  Estados 
Unidos  El  ejercicio  10.40  examino  un 
anuncio  de  Albertsons,  una  cadena  de  supermercados 
del  oeste  de  Estados  Unidos.  El  anunciante  dice  que 
Albertsons  de  manera  consistente  ha  tenido  precios 
mas  bajos  que  otros  cuatro  supermercados  de  surtido 
completo.  Como  parte  de  un  estudio  realizado  por 
una  “compafha  independiente  para  verificar  precios 
de  articulos  basicos”,  el  promedio  de  total  semanal 
basado  en  los  precios  de  aproximadamente  95  articulos 
se  da  para  cinco  cadenas  diferentes  de  supermercados, 
registrado  durante  4  semanas  consecutivas.6 


Albertsons 

Ralphs 

Vons 

Alpha  Beta 

Lucky 

Semana  1 

$254.26 

$256.03 

$267.92 

$260.71 

$258.84 

Semana  2 

240.62 

255.65 

251.55 

251.80 

242.14 

Semana  3 

231.90 

255.12 

245.89 

246.77 

246.80 

Semana  4 

234.13 

261.18 

254.12 

249.45 

248.99 

a.  7,  Que  tipo  de  diseno  se  ha  usado  en  este  experimento? 

b.  Realice  un  analisis  de  varianza  de  los  datos. 

c.  7,  Hay  suficiente  evidencia  para  indicar  que  existe 
diferencia  en  el  promedio  total  semanal  para  los  cinco 
supermercados?  Use  a  =  .05. 

d.  Use  el  metodo  de  Tukey  para  comparaciones 
apareadas  para  determinar  cuales  de  las  medias 
son  significativamente  diferentes  una  de  otra. 

Use  a  =  .05. 

(^)datos  11.68  ‘reduction  de  trigo  Las 

producciones  de  trigo  (en  bushels  por  acre) 
se  compararon  para  cinco  variedades  diferentes,  A,  B, 

C,  D  y  E,  en  seis  lugares  diferentes.  Cada  variedad  fue 
asignada  al  azar  a  un  lote  en  cada  lugar.  Los  resultados 
del  experimento  se  muestran  en  la  tabla  siguiente,  junto 
con  una  salida  impresa  MINITAB  del  analisis  de  varianza. 
Analice  el  experimento  usando  el  metodo  apropiado. 
Identifique  los  tratamientos  de  factores  de  interes  para 
el  experimentador  e  investigue  cualquier  efecto  que 
exista.  Use  las  graficas  de  diagnostico  sobre  la  validez  del 
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analisis  de  varianza  de  las  suposiciones.  /Cuales  son  las 
implicaciones  practicas  de  este  experimento?  Redacte  un 
parrafo  que  explique  los  resultados  de  su  analisis. 


Lugar 


Variedad 

1 

2 

3 

4 

5 

6 

A 

35.3 

31.0 

32.7 

36.8 

37.2 

33.1 

B 

30.7 

32.2 

31.4 

31.7 

35.0 

32.7 

C 

38.2 

33.4 

33.6 

37.1 

37.3 

38.2 

D 

34.9 

36.1 

35.2 

38.3 

40.2 

36.0 

E 

32.4 

28.9 

29.2 

30.7 

33.9 

32.1 

Salida  impresa  MINITAB  para  el  ejercicio  11.68 

ANOVA  de  dos  vias:  production  contra  variedades,  lugar 


Source 

Varieties 

Locations 

Error 

Total 


DF  SS  MS  F  P 

4  142.670  35.6675  18.61  0.000 

5  68.142  13.6283  7.11  0.001 

20  38.303  1.9165 

29  249.142 


S  =  1.384  R-Sq 


84.62%  R-Sq(adj)  =  77.69% 


Varieties 

A 

B 

C 

D 

E 


Individual  95%  CIs  For  Mean  Based  on 
Pooled  StDev 


Mean  + - + - + - + - 

34.3500  ( - * - ) 

32.2833  ( - * - ) 

36.3000  ( - * - ) 

36.7833  ( - * - ) 

31.2000  ( - * - ) 


acondicionamiento  cardio-respiratorio  en 
jovenes  de  12  a  19  anos  de  edad.7  Alcanzar  estandares 
de  acondicionamiento  es  un  requisite  previo  para 
ingresar  a  ocupaciones  como  aplicacion  de  la  ley, 
bomberos  y  fuerzas  militares,  asf  como  otros  trabajos 
que  comprenden  un  trabajo  fisicamente  demandante.  La 
admision  maxima  estimada  de  oxfgeno  (V02max)  se  utilizo 
para  medir  el  nivel  cardio-respiratorio  de  una  persona. 

El  foco  de  nuestro  estudio  investiga  la  relacion  entre 
niveles  de  actividad  ffsica  (mas  que  otros,  igual  que  otros 
o  menos  que  otros)  y  genero  en  V02lrlax-  Los  dates  que 
siguen  estan  basados  en  este  estudio. 


Actividad  fisica 


Mas 

Igual 

Menos 

Hombres 

50.1 

45.7 

40.9 

47.2 

44.2 

41.3 

49.7 

46.8 

39.2 

50.4 

44.9 

40.9 

Mujeres 

41.2 

37.2 

36.5 

39.8 

39.4 

35.0 

41.5 

38.6 

37.2 

38.2 

37.8 

35.4 

30.0  32.0  34.0  36.0 

Graficas  de  diagnostico  MINITAB  para  el  ejercicio  1 1 .68 


(^)datos  11.69  Acondicionamiento  fi'sico  Los 

investigadores  Russell  R.  Pate  y  colegas 
analizaron  los  resultados  del  National  Health  and 
Nutrition  Examination  Survey  para  evaluar  niveles  de 


a.  (',Es  este  un  experimento  factorial  o  un  diseflo  de 
bloque  aleatorizado?  Explique. 

b.  ('.Hay  interaccion  significativa  entre  niveles 
de  actividad  fisica  y  genero?  ^Hay  diferencias 
significativas  entre  hombres  y  mujeres?  entre 
niveles  de  actividad  ffsica? 

c.  Si  la  interaccion  es  significativa,  use  el  procedimiento 
de  Tukey  por  pares  para  investigar  diferencias  entre 
las  seis  medias  de  celda.  Comente  sobre  los  resultados 
hallados  usando  este  procedimiento.  Use  a  =  .05. 

(^)  datos  1 1 .70  En  un  estudio  de  salarios  iniciales  de 
profesores  auxiliares,8  cinco  profesores  au- 
xiliares  hombres  y  cinco  profesoras  auxiliares  mujeres 
de  cada  uno  de  tres  tipos  de  instituciones  que  otorgan 
tftulos  de  doctorado,  fueron  encuestados  y  se  registraron 
sus  salarios  iniciales  bajo  la  condicion  de  anonimato.  Los 
resultados  de  la  encuesta  en  unidades  de  1000  dolares  se 
dan  en  la  tabla  siguiente. 


Universidades 

Privadas/ 

Relacionados 

Genero 

publicas 

Independientes 

con  iglesias 

$57.3 

$85.8 

$78.9 

57.9 

75.2 

69.3 

Hombres 

56.5 

66.9 

69.7 

76.5 

73.0 

58.2 

62.0 

73.0 

61.2 

47.4 

62.1 

60.4 

56.7 

69.1 

62.1 

Mujeres 

69.0 

66.5 

59.8 

63.2 

61.8 

71.9 

65.3 

76.7 

61.6 

Fuente :  Basado  en  "Average  Salary  for  Men  and  Women  Faculty  by  Category,  Affiliation, 
and  Academic  Rank,  2005-2006". 
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a.  ^Que  tipo  de  diseno  se  utiliza  para  recolectar  estos 
datos? 

b.  Use  un  analisis  de  varianza  para  probar  si  hay 
diferencias  significativas  en  genero,  en  tipo 
de  institucion  y  para  probar  si  hay  interaccion 
significativa  de  genero  X  tipo  de  institucion. 

c.  Encuentre  una  estimacion  de  intervalo  de  confianza 
de  95%  para  la  diferencia  en  salarios  iniciales  para 
profesores  auxiliares  hombres  y  profesoras  auxiliares 
mujeres.  Interprete  este  intervalo  en  terminos  de  una 
diferencia  de  genero  en  salarios  iniciales. 

d.  Use  el  procedimiento  de  Tukey  para  investigar 
diferencias  en  salarios  de  profesores  auxiliares  para 
los  tres  tipos  de  instituciones.  Use  a  =  .01. 

e.  Haga  un  resumen  de  los  resultados  de  su  analisis. 

datos  1 1.71  Ceramica  en  el  Reino  Unido  Un 

articulo  en  Archaeometry  contem'a  un  analisis 
de  26  muestras  de  ceramica  romano-britanica,  halladas  en 
homos  de  cuatro  lugares  diferentes  en  el  Reino  Unido.9 
Como  un  sitio  dio  solo  dos  muestras,  considere  las  muestras 
halladas  en  los  otros  tres  sitios.  Las  muestras  fueron 
analizadas  para  determinar  su  composicion  quimica  y  a 
continuacion  se  indica  el  porcentaje  de  oxido  de  hierro. 


Llanederyn 

Island  Thorns 

Ashley  Rails 

7.00 

5.78 

1.28 

1.12 

7.08 

5.49 

2.39 

1.14 

7.09 

6.92 

1.50 

.92 

6.37 

6.13 

1.88 

2.74 

7.06 

6.64 

1.51 

1.64 

6.26 

6.69 

4.26 

6.44 

a.  7,  Que  tipo  de  diseno  experimental  es  este? 

b.  Use  un  analisis  de  varianza  para  determinar  si  hay  una 
diferencia  en  el  promedio  de  porcentaje  de  oxido  de 
hierro  en  los  tres  sitios.  Use  a  =  .01. 

c.  Si  usted  tiene  acceso  a  un  programa  de  computo, 
genere  las  graficas  de  diagnostico  para  este 
experimento.  ^Le  parece  que  alguno  de  los  analisis  de 
suposiciones  de  varianza  han  sido  violados?  Explique. 

(^)datos  11.72  Telefonos  celulares  ^ Que  tan 

satisfecho  esta  usted  con  su  actual  proveedor 
de  servicio  de  telefono  movil?  Encuestas  efectuadas 
por  Consumer  Reports  indican  que  hay  un  alto  nivel  de 
insatisfaccion  entre  consumidores,  lo  cual  resulta  en  altos 
porcentajes  de  rotation  de  clientes.10  La  tabla  siguiente 
muestra  las  calificaciones  totales  de  satisfaccion, 
basadas  en  una  calificacion  maxima  de  100,  para  cuatro 
proveedores  de  servicios  inalambricos  en  cuatro  ciudades 
diferentes. 


San 


Chicago 

Dallas 

Philadelphia 

Francisco 

AT&T  Wireless 

63 

66 

61 

64 

Cingular  Wireless 

67 

67 

64 

60 

Sprint 

60 

68 

60 

61 

Verizon  Wireless 

71 

75 

73 

73 

a.  ^Que  tipo  de  diseno  experimental  se  utilizo  en  este 
articulo?  Si  el  diseno  empleado  es  un  diseno  de  bloque 
aleatorizado,  ^cuales  son  los  bloques  y  cuales  son  los 
tratamientos? 

b.  Efectue  un  analisis  de  varianza  para  los  datos. 

c.  7,  Hay  diferencias  significativas  en  el  promedio 
de  calificaciones  de  satisfaccion  para  los  cuatro 
proveedores  de  servicios  inalambricos  considerados 
aqui? 

d.  ^Hay  diferencias  significativas  en  el  promedio  de 
calificaciones  de  satisfaccion  para  las  cuatro  ciudades? 

1 1 .73  Telefonos  celulares,  continua  Consulte  el 
ejercicio  1 1.72.  Las  graficas  de  diagnostico  para  este 
experimento  se  ilustran  a  continuacion.  (',Le  parece  que 
alguno  de  los  analisis  de  varianza  de  las  suposiciones  ha 
sido  violado?  Explique. 


(^)datos  11.74  Salarios  de  profesores  II  Cada 
ano,  la  American  Association  of  University 
Professors  informa  sobre  salarios  de  profesores 
academicos  en  universidades  y  colegios  en  Estados 


www.FreeLibros.me 


caso  prActico  o  501 


Unitlos.  ’  Los  datos  que  siguen  (en  miles  de  dolares), 
adaptados  de  este  informe,  estan  basados  en  muestras  de 
n  —  10  en  cada  uno  de  tres  rangos  de  profesores,  para 
profesores  hombres  y  mujeres. 


Rango 

Profesor 

Profesor 

Profesor  de 

Genero 

auxiliar 

adjunto 

tiempo  completo 

Hombre 

$63.9 

$64.4 

$70.0 

$74.4 

$109.4 

$110.5 

63.9 

62.2 

77.7 

77.2 

111.3 

104.4 

64.8 

64.2 

77.1 

76.3 

112.5 

106.3 

68.3 

64.9 

76.0 

78.8 

111.6 

106.9 

67.5 

67.5 

70.1 

73.1 

118.3 

109.9 

Mujer 

56.6 

59.0 

65.4 

66.3 

110.3 

100.9 

57.6 

58.6 

71.9 

74.6 

97.0 

102.8 

53.5 

54.9 

65.9 

73.0 

91.5 

102.0 

64.4 

62.9 

67.9 

69.4 

103.5 

96.7 

62.6 

59.8 

73.6 

71.0 

95.6 

97.8 

Fuente :  Con  base  en  "Average  Salary  for  Men  and  Women  Faculty  by  Category,  Affiliation, 
and  Academic  Rank,  2005-2006". 


a.  Identifique  el  diseno  empleado  en  este  estudio. 

b.  Use  el  analisis  de  varianza  apropiado  para  estos  datos. 

c.  (',Los  datos  indican  que  el  salario  en  los  diferentes 
rangos  varfa  por  genero? 

d.  Si  no  hay  interaccion,  determine  si  hay  diferencias 
en  salarios  por  rango  y  si  hay  diferencias  por  genero. 
Discuta  sus  resultados. 

e.  Grafique  el  promedio  de  salarios  usando 
una  grafica  de  interaccion.  Si  el  principal 

efecto  de  rangos  es  significativo,  use  el  metodo  de 
Tukey  de  comparaciones  por  pares  para  determinar  si 
hay  diferencias  significativas  entre  los  rangos. 

Use  a  =  .01. 


CASO 

prActico  P  "Un  buen  desorden" 


(ySe  arriesga  usted  a  una  infraccion  por  estacionarse  donde  no  debe  por  olvidar  cuanto 
tiempo  le  queda  en  el  parquimetro?  (;Las  multas  relacionadas  con  varias  infracciones 
varfan  dependiendo  de  la  ciudad  en  la  que  recibe  usted  la  infraccion?  Para  ver  este  pro- 
blema,  las  multas  impuestas  por  rebasar  tiempo,  estacionarse  en  zona  roja  y  estacionarse 
junto  a  un  hidrante  de  bomberos  se  registraron  para  13  ciudades  del  sur  de  California.11 


Ciudad 

Rebasar  tiempo 

Zona  roja 

Hidrante  de  bomberos 

Long  Beach 

$17 

$30 

$30 

Bakersfield 

17 

33 

33 

Orange 

22 

30 

32 

San  Bernardino 

20 

30 

78 

Riverside 

21 

30 

30 

San  Luis  Obispo 

8 

20 

75 

Beverly  Hills 

23 

38 

30 

Palm  Springs 

22 

28 

46 

Laguna  Beach 

22 

22 

32 

Del  Mar 

25 

40 

55 

Los  Angeles 

20 

55 

30 

San  Diego 

35 

60 

60 

Newport  Beach 

32 

42 

30 

Fuente :  De  "A  Fine  Mess",  por  R.  McGarvey,  Avenues,  julio/agosto  de  1994.  Reimpreso  con  permiso  del  autor. 


1.  Identifique  el  diseno  empleado  para  la  recoleccion  de  datos  en  este  estudio  practico. 

2.  Analice  los  datos  usando  el  analisis  apropiado.  7,  Que  se  puede  decir  de  la  variacion 
entre  las  ciudades  en  este  estudio?  Y  de  las  multas  para  los  tres  tipos  de  violaciones? 
7  El  procedimiento  de  Tukey  se  puede  usar  para  delinear  mas  aun  algunas  diferencias 
significativas  que  puedan  hallarse?  7  Las  estimaciones  de  intervalo  de  confianza  serian 
utiles  en  su  analisis? 

3.  Haga  un  resumen  de  los  resultados  de  su  analisis  de  estos  datos. 
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Regresion  lineal 
y  correlacion 


©  Roza^Dreamstime 


OBJETIVOS  GENERALES 

En  este  capitulo,  consideramos  la  situacion  en  la  que  el 
valor  medio  de  una  variable  aleatoria  yesta  relacionada 
con  otra  variable  x.  Al  medir  tanto  y  como  x  para  cada 
unidad  experimental,  con  lo  cual  se  generan  datos  bivaria- 
dos,  se  puede  usar  la  informacion  dada  por  xpara  estimar 
el  valor  promedio  de  y  y  para  predecir  valores  de  y  para 
valores  de  xasignados  previamente. 


IN  DICE  DEL  CAPITULO 

Analisis  de  varianza  para  regresion  lineal  (12.4) 
Analisis  de  correlacion  (12.8) 

Herramientas  de  diagnostico  para  verificar 
las  suposiciones  de  regresion  (12.6) 

Estimacion  y  prediccion  con  uso  de  la  recta 
ajustada  (12.7) 

El  metodo  de  minimos  cuadrados  (12.3) 

Un  modelo  probabilfstico  lineal  sencillo  (12.2) 

Prueba  de  la  utilidad  del  modelo  de  regresion  lineal: 
inferencias  acerca  de  13,  la  prueba  Fde  ANOVA, 
y  i2  (12.5) 


ENTRENADOR  PERSONAL 


iComo  estar  seguro  de  que  mis  calculos 
son  correctos? 


•  {Su  auto  esta  "Hecho 
[  en  EE.UU-"? 

La  frase  “Hecho  en  EE.UU.”  se  ha  convertido  en 
grito  de  batalla  en  los  ultimos  anos  porque  los 
trabajadores  estadounidenses  tratan  de  proteger 
sus  trabajos  contra  la  competencia  extranjera.  En 
el  caso  practico  del  bnal  de  este  capitulo  explo- 
ramos  las  cambiantes  actitudes  de  consumidores 
estadounidenses  hacia  autos  hechos  fuera  de  Es- 
tados  Unidos,  usando  un  sencillo  analisis  de  re¬ 
gresion  lineal. 
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INTRODUCCION 


Los  estudiantes  de  ultimo  ano  de  preparatoria,  los  de  primer  ano  de  universidad,  sus 
padres,  asf  como  la  administracion  de  una  universidad  estan  preocupados  por  el  ren- 
dimiento  academico  de  un  estudiante  despues  de  haberse  inscrito  en  la  universidad. 
^Se  puede  estimar  o  predecir  el  promedio  de  calificaciones  de  un  estudiante  (GPA)  al 
terminar  su  primer  ano,  antes  de  inscribirse  en  la  universidad?  A  primera  vista,  este 
podrfa  ser  un  problema  diffcil  aunque  es  de  esperarse  que  los  estudiantes  altamente 
motivados,  que  se  hayan  graduado  con  calibcaciones  altas  de  una  preparatoria,  alcancen 
un  alto  promedio  GPA  cuando  terminen  el  primer  ano.  Por  otra  parte,  los  estudiantes  que 
carezcan  de  motivacion  o  que  hayan  obtenido  un  exito  solo  parcial  en  preparatoria  no  es 
probable  que  la  hagan  bien.  Se  esperarfa  que  el  rendimiento  academico  de  un  estudiante 
sea  una  funcion  de  diversas  variables: 


•  Rango  en  su  grupo  de  preparatoria 

•  Nivel  general  de  preparatoria 

•  Alto  promedio  GPA 

•  Calibcaciones  del  SAT 


Este  problema  es  de  naturaleza  mas  bien  general.  Usted  estara  interesado  en  una 
variable  aleatoria  y  (promedio  GPA)  relacionada  con  diversas  variables  independien- 
tes.  El  objetivo  es  crear  una  ecuacidn  de  prediction  que  exprese  y  como  funcion  de 
estas  variables  independientes.  A  continuacion,  si  se  pueden  medir  las  variables  inde- 
pendientes,  se  pueden  sustituir  estos  valores  en  la  ecuacion  de  prediccion  y  obtener  la 
prediccion  para  y,  es  decir,  el  promedio  GPA  del  estudiante  en  nuestro  ejemplo.  Pero, 
^cuales  variables  deben  usarse  para  hacer  la  prediccion?  ^Que  tan  fuerte  es  su  relacion 
con  v?  (  Como  se  construye  una  buena  ecuacidn  de  prediccion  para  y  como  funcion  de 
las  variables  seleccionadas  para  la  prediccion?  Contestaremos  estas  preguntas  en  los 
siguientes  dos  capitulos. 

En  este  capitulo,  restringimos  nuestra  atencion  al  sencillo  problema  de  predecir  y  como 
funcion  lineal  de  una  sola  variable  x  de  pronostico.  Este  problema  originalmente  se 
abordo  en  el  capitulo  3  en  la  exposicion  de  datos  bivariados.  Recuerde  que  utilizamos 
la  ecuacidn  de  una  recta  para  describir  la  relacion  entre  x  y  y  y  describimos  la  fuerza 
de  la  relacion  usando  el  coebciente  de  correlacion  r.  Nos  apoyaremos  en  algunos  de 
estos  resultados  cuando  repasemos  el  tema  de  regresion  y  correlacion  lineales. 


MODELO  PROBABILfSTICO  LINEAL  SIMPLE 

Considere  el  problema  de  tratar  de  predecir  el  valor  de  una  respuesta  y  basada  en  el  valor 
de  una  variable  independiente  x.  La  recta  de  mejor  ajuste  del  capitulo  3, 


y  =  a  +  bx 


estuvo  basada  en  una  muestra  de  n  observaciones  bivariadas  tomadas  de  una  poblacion 
mas  grande  de  medidas.  La  recta  que  describe  la  relacion  entre  y  y  x  en  la  poblacion  es 
semejante  a  la  recta  de  mejor  ajuste  de  la  muestra,  pero  no  es  igual.  (  Como  se  puede  cons- 
truir  un  modelo  de  poblacion  para  describir  la  relacion  entre  una  variable  aleatoria  y 
y  una  variable  x  independiente  relacionada? 

Se  empieza  por  suponer  que  la  variable  de  interes,  y,  esta  linealmente  relacionada  a 
una  variable  independiente  x.  Para  describir  la  relacion  lineal,  se  puede  usar  el  modelo 
determinista 


y  =  a  +  /3x 
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donde  a  es  la  intersection  con  el  eje  y,  es  decir,  el  valor  de  y  cuando  x  =  0.  y  /J  es  la 
pendiente  de  la  recta,  definida  como  el  cambio  en  y  para  un  cambio  unitario  en  x,  como 
se  muestra  en  la  figura  12.1.  Este  modelo  describe  una  relacion  determinista  entre  la 
variable  de  interes  v,  a  veces  llamada  variable  de  respuesta,  y  la  variable  independiente 
x,  denominada  variable  de  pronostico.  Esto  es,  la  ecuacion  lineal  determina  un  valor 
exacto  de  y  cuando  se  da  el  valor  de  x.  yEstc  modelo  es  realista  para  una  situation  expe¬ 
rimental?  Considere  el  siguiente  ejemplo. 


FIGURA  1  2.1 

Interseccion  con  el  eje  y 
y  pendiente  de  una  recta 


CONSEJO 

pendiente  =  cambio  en  y 
para  un  cambio  unitario  en  x. 
cruce  con  eje  y  =  valor  de  y 
cuando  x  =  0. 


La  tabla  12.1  muestra  las  calificaciones  del  examen  de  matematicas  de  n  =  10  estu- 
diantes  de  primer  ano  de  universidad,  junto  con  sus  calificaciones  finales  en  calculo. 
Una  grafica  bivariada  de  estos  puntos  y  calificaciones  se  da  en  la  figura  12.2.  Se  puede 
usar  el  applet  Building  a  Scatter-plot  (Construction  de  una  grafica  de  dispersion)  como 
recordatorio  de  como  se  traza  esta  grafica.  Observe  que  los  puntos  no  estan  exactamente 
sobre  una  recta  sino  que  mas  bien  parecen  ser  desviaciones  alrededor  de  una  recta  fun¬ 
damental.  Una  forma  sencilla  de  modificar  el  modelo  determinista  es  agregar  un  com- 
ponente  aleatorio  de  error  para  explicar  las  desviaciones  de  los  puntos  alrededor  de  la 
recta.  Una  respuesta  particular  y  se  describe  usando  el  modelo  probabilistico 

y  =  a  +  i Bx  +  e 


Calificaciones  de  examen  de  matematicas  y  puntos  finales  en  calculo 
TABLA  12.1  para  estudiantes  de  primer  ano  de  universidad 


Estudiante 

Calificacion  de 
examen  de 
matematicas 

Puntos 
finales  en 
calculo 

1 

39 

65 

2 

43 

CO 

3 

21 

52 

4 

64 

82 

5 

57 

92 

6 

47 

89 

7 

28 

73 

8 

75 

98 

9 

34 

56 

10 

52 

75 
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FIGURA  1  2.2 

Grafica  de  dispersion  de 
datos  de  la  tabla  12.1 


La  primera  parte  de  la  ecuacion,  a  +  fix,  llamada  recta  de  medias,  describe  el  valor 
promedio  de  y  para  un  valor  determinado  de  x.  El  componente  de  error  e  permite  que 
cada  respuesta  individual  y  se  desvie  de  la  recta  de  medias  en  una  pequena  cantidad. 

Para  usar  este  modelo  probabilistico  para  hacer  inferencias,  es  necesario  ser  mas 
especifico  acerca  de  esta  “pequena  cantidad”,  e. 


SUPOSICIONES  ACERCA  DEL  ERROR  ALEATORIO  e 

Suponga  que  los  valores  de  e  satisfacen  estas  condiciones: 

•  Son  independientes  en  el  sentido  probabilistico 

•  Tienen  una  media  de  0  y  una  varianza  comun  igual  a  er2 

•  Tienen  una  distribution  normal  de  probabilidad 

Estas  suposiciones  acerca  del  error  aleatorio  e  se  muestran  en  la  figura  12.3  para  tres 
valores  fijos  de  x,  por  ejemplo  x,,  x2  y  x3.  Observe  la  similitud  entre  estas  suposiciones  y 
las  suposiciones  necesarias  para  las  pruebas  en  los  capitulos  10  y  11.  Repasaremos  estas 
suposiciones  mas  adelante  en  este  capitulo  y  daremos  algunas  herramientas  de  diagnos- 
tico  para  que  usted  las  use  al  verificar  la  validez  de  ellas. 
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Recuerde  que  este  modelo  esta  creado  para  una  poblacion  de  mediciones  que  por  lo 
general  es  desconocida,  pero  puede  usar  informacion  muestral  para  estimar  los  valores 
de  a  y  yS,  que  son  los  coeficientes  de  la  recta  de  medias,  E(y)  =  a  +  (3.x.  Estas  estimacio- 
nes  se  usan  para  formar  la  recta  de  mejor  ajuste  para  un  conjunto  de  datos  determinado, 
llamado  recta  de  mmimos  cuadrados  o  recta  de  regresion.  En  la  siguiente  seccion 
repasamos  la  forma  de  calcular  el  punto  de  cruce  y  la  pendiente  de  esta  recta. 


EL  METODO  DE  MINIMOS  CUADRADOS 


El  procedimiento  estadistico  para  hallar  la  recta  de  mejor  ajuste  para  un  conjunto  de  datos 
bivariados  hace,  matematicamente,  lo  que  en  forma  visual  se  realiza  cuando  se  mueve 
una  regia  hasta  que  se  hayan  reducido  al  minimo  las  distancias  verticales  o  desviaciones, 
de  la  regia  a  un  conjunto  de  puntos.  La  formula  de  la  recta  de  mejor  ajuste  es 


pendiente  =  coeficiente  de  x. 

cruce  con  eje  y  =  termino 
constante. 


y  =  a  +  bx 

donde  ay  b  son  las  estimaciones  de  los  parametros  ay  (3  de  punto  de  cruce  y  pendiente, 
respectivamente.  La  recta  ajustada  para  los  datos  de  la  tabla  12.1  se  muestra  en  el  applet 
Method  of  Least  Squares  (Metodo  de  mmimos  cuadrados),  figura  12.4.  Las  rectas  ver¬ 
ticales  rojas  (azul  claro  en  la  figura  12.4)  trazadas  de  la  recta  de  prediction  a  cada  punto 
(x„  yd  representan  las  desviaciones  de  los  puntos  desde  la  recta. 


FIGURA  12.4 

Applet  Method  of  Least 
Squares 


Grade  =  40.8  +  0.77  *  SCO 


5i-"-!1G  0  20.0  30.0  40.0  50.0  60.0  70.0  80.0 
SSE  -  Score 

606.0 
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Para  reducir  al  mmimo  las  distancias  desde  los  puntos  a  la  recta  ajustada,  se  puede 
usar  el  principio  de  mmimos  cuadrados. 


PRINCIPIO  DE  MINIMOS  CUADRADOS 

La  recta  que  reduce  al  mfnimo  la  suma  de  cuadrados  de  las  desviaciones  de  los  valo¬ 
res  observados  de  y  desde  los  pronosticados  es  la  recta  de  mejor  ajuste.  La 
suma  del  cuadrado  de  las  desviaciones  por  lo  general  se  denomina  suma  de 
cuadrados  de  error  (SSE)  y  se  define  como 

SSE  =  X(y,-  ~  yf  =  X(y,  -  a  -  bxf 
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Observe  la  recta  de  regresion  y  los  puntos  de  la  figura  12.4.  SSE  es  la  suma  del  cuadrado 
de  las  distancias  representada  por  el  area  de  los  cuadros  amarillos  (azul  claro  en  la  figura 
12.4). 

Hallar  los  valores  de  a  y  b,  las  estimaciones  de  a  y  /3,  usa  calculo  diferencial,  que 
esta  fuera  del  proposito  de  este  libro.  En  lugar  de  derivar  sus  valores,  simplemente  pre- 
sentaremos  formulas  para  calcular  los  valores  de  ay  b,  llamados  estimadores  de  mini- 
mos  cuadrados  de  a  y  (3.  Usaremos  una  notation  que  esta  basada  en  las  sumas  de 
cuadrados  para  las  variables  del  problema  de  regresion,  que  es  semejante  en  forma  a 
las  sumas  de  cuadrados  empleadas  en  el  capitulo  1 1 .  Estas  formulas  se  ven  diferentes 
de  las  formulas  presentadas  en  el  capitulo  3,  pero  en  realidad  son  identicas  desde  el 
punto  de  vista  del  algebra. 

Usted  debe  usar  el  metodo  de  entrada  de  datos  para  su  calculadora  cientifica  para 
introducir  los  datos  muestrales. 

•  Si  su  calculadora  tiene  solo  una  funcion  estadistica  de  una  variable,  todavia 
puede  ahorrar  tiempo  al  hallar  las  sumas  necesarias  y  sumas  de  cuadrados. 

•  Si  su  calculadora  tiene  una  funcion  estadistica  de  dos  variables  o  si  tiene  una 
calculadora  graficadora,  la  calculadora  en  forma  automatica  guarda  todas  las 
sumas  y  sumas  de  cuadradas,  asi  como  los  valores  de  a,  by  el  coeficiente  de 
correlation  r. 

•  Asegurese  de  consultar  el  manual  de  su  calculadora  para  hallar  la  forma  mas  facil 
de  obtener  los  estimadores  de  minimos  cuadrados. 


ESTIMADORES  DE  MINIMOS  CUADRADOS  DE  a  Y  p 


b  =  -4-  y  a  =  y  —  bx 

U XX 


'xx 


donde  las  cantidades  Sxy  y  Sxx  estan  definidas  como 


y 


Observe  que  la  suma  de  cuadrados  de  los  valores  x  se  encuentra  usando  la  formula  de 
computo  dada  en  la  section  2.3  y  la  suma  de  los  productos  cruz  es  el  numerador  de  la 
covarianza  definida  en  la  section  3.4. 

Encuentre  la  recta  de  prediction  de  minimos  cuadrados  para  los  datos  de  la  calificacion 
en  calculo  de  la  tabla  12.1. 

Solucion  Use  los  datos  de  la  tabla  12.2  y  el  metodo  de  introduction  de  datos  en  su 
calculadora  cientifica  para  hallar  las  siguientes  sumas  de  cuadrados: 


=  36854  - 


(460)060)  =  1894 
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tabla  12.1  Calculos  para  los  datos  de  la  tabla  12.1 


Vi 

Xj 

x? 

m 

y2i 

65 

39 

1521 

2535 

4225 

78 

43 

1849 

3354 

6084 

52 

21 

441 

1092 

2704 

82 

64 

4096 

5248 

6724 

92 

57 

3249 

5244 

8464 

89 

47 

2209 

4183 

7921 

73 

28 

784 

2044 

5329 

98 

75 

5625 

7350 

9604 

56 

34 

1156 

1904 

3136 

75 

52 

2704 

3900 

5625 

Suma  760 

460 

23634 

36854 

59816 

Entonces 

consejo  b  =  ^  =  =  .76556  y  a  =  y  -  bx  =  16  -  (.76556)(46)  =  40.78424 

Se  puede  predecir  ypara  -^+/4 

La  recta  de  regresion  de  mmirnos  cuadrados  es  entonces 

al  sustituir  xen  la  ecuacion 

y  =  a  +  bx  =  40.78424  +  .76556x 

La  grafica  de  esta  recta  se  ve  en  la  figura  12.4.  Ahora  se  puede  usar  para  predecir  y  para 
un  valor  determinado  de  x,  ya  sea  consultando  la  figura  12.4  o  sustituyendo  el  valor 
apropiado  de  x  en  la  ecuacion.  Por  ejemplo,  si  un  alumno  de  primer  ano  obtuvo  x  =  50 
en  el  examen,  la  calificacion  pronosticada  de  calculo  del  estudiante  es  (usando  precision 
completa  de  decimales) 

y  =  a  +  b( 50)  =  40.78424  +  (,76556)(50)  =  79.06 


m 


ENTRENADOR  PERSONAL 

iComo  estar  seguro  que  mis  calculos  son  correctos? 


•  Tenga  cuidado  con  los  errores  de  redondeo.  Lleve  al  menos  seis  cifras  significati- 
vas  y  haga  redondeo  solo  al  informal-  el  resultado  final. 

•  Use  una  calculadora  cientffica  o  graficadora  para  hacer  todo  el  trabajo.  Casi  todas 
las  calculadoras  calcularan  los  valores  de  a  y  b  si  se  le  introducen  correctamente 
los  datos. 

•  Use  un  programa  de  computadora  si  tiene  acceso  a  ella. 

•  Siempre  grafique  los  datos  y  la  recta.  Si  la  recta  no  se  ajusta  a  los  puntos,  jes 
probable  que  el  usuario  tenga  un  error! 


Se  puede  usar  el  applet  Method  of  Least  Squares  (Metodo  de  minimos  cuadrados) 
para  hallar  los  valores  de  a  y  b  que  determinan  la  recta  de  mejor  ajuste,  y  =  a  +  bx. 
La  recta  horizontal  que  se  ve  en  la  recta  y  =  y.  Use  el  mouse  de  su  PC  para  arrastrar 
la  recta  y  vea  que  cambia  el  tamano  de  los  cuadros  amarillos.  El  problema  es  hacer  el 
SSE.  el  area  total  de  los  cuadros  amarillos  (azul  claro  en  la  figura  12.4)  tan  pequena 
como  sea  posible.  El  valor  de  SSE  es  la  parte  roja  de  la  barra  a  la  izquierda  del  applet 

(azul  oscuro  en  la  figura  12.4)  marcada  SSE  = _ Cuando  usted  piense  que  ha 

reducido  el  SSE  al  mmimo,  haga  clic  en  el  boton  Bl'  1  y  jvea  que  bien  lo  hizo! 
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UN  ANALISIS  DE  VARIANZA 
PARA  REGRESION  LINEAL 

En  el  capitulo  1 1  utilizamos  el  analisis  de  procedimientos  de  varianza  para  dividir  la 
variation  total  del  experimento  en  partes  atribuidas  a  diversos  factores  de  interes  para  el 
experimentador.  En  un  analisis  de  regresion,  la  respuesta  y  esta  relacionada  con  la  varia¬ 
ble  independiente  x.  En  consecuencia,  la  variation  total  de  la  variable  de  respuesta  y, 
dada  por 


SS  Total  =  S„  =  2(y,  -  yf  =  Xy2 


(Xy,)2 


esta  dividida  en  dos  partes: 

•  La  SSR  (suma  de  cuadrados  para  regresion)  mide  la  cantidad  de  variation  expli- 
cada  al  usar  la  recta  de  regresion  con  una  variable  independiente  x 

•  La  SSE  (suma  de  cuadrados  de  error)  mide  la  variation  “residual”  en  los  datos 
que  no  esta  explicada  por  la  variable  independiente  x 


de  modo  que 

SS  Total  =  SSR  +  SSE 

Para  un  valor  particular  de  la  respuesta  y„  se  puede  visualizar  este  desglose  en  la  varia¬ 
tion  usando  las  distancias  verticales  ilustradas  en  la  figura  12.5.  Se  puede  ver  que  la  SSR 
es  la  suma  del  cuadrado  de  desviaciones  de  las  diferencias  entre  la  respuesta  estimada 
usando  x  (y)  y  la  respuesta  estimada  usando  x  (la  recta  de  regresion,  y);  la  SSE  es  la 
suma  del  cuadrado  de  diferencias  entre  la  recta  de  regresion  (y)  y  el  punto  y. 


No  es  demasiado  diffcil  demostrar  algebraicamente  que 

SSR  =  2(y,  -  y;)2  =  £(a  +  bx,  -  y)2  =  £(y  -  bx  +  bxt  -  y  f  =  bX(xt  -  x)2 


Como  SS  Total  =  SSR  +  SSE,  se  puede  completar  la  partition  al  calcular 

(S  l2 

SSE  =  SS  Total  -  SSR  =  Syv  - 

^XX 
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Recuerde  del  capitulo  1 1  que  cada  una  de  las  diversas  fuentes  de  variation,  cuando  se 
dividen  entre  los  grados  de  libertad  apropiados,  da  una  estimation  de  la  variation  del 
experimento.  Estas  estimaciones  se  denominan  mmimos  cuadrados,  MS  =  SS/df  y  se 
ven  en  una  tabla  ANOVA. 

A1  examinar  los  grados  de  libertad  asociados  con  cada  una  de  estas  sumas  de  cuadra¬ 
dos,  observe  que  el  total  de  grados  de  libertad  para  n  mediciones  es  (n  —  1).  Como  la 
estimation  de  la  recta  de  regresion,  y  =  a  +  bxt  =  y  —  bx  +  bx, ,  abarca  la  estimation 
de  un  pardmetro  adicional  yS,  hay  un  grado  de  libertad  asociado  con  la  SSR,  dejando 
(n  —  2)  gi'ados  de  libertad  con  la  SSE. 

A1  igual  que  con  todas  las  tablas  ANOVA  que  hemos  estudiado,  el  error  medio  cua- 
dratico 

MSE  =  s2  = 

n  —  2 

es  un  estimador  insesgado  de  la  varianza  fundamental  a2.  El  analisis  de  la  tabla  de 
varianza  se  ve  en  la  tabla  12.3. 


TABLA  12.3  Analisis  de  varianza  para  regresion  lineal 


Fuente 

df 

SS 

MS 

Regresion 

1 

(Sj 

s„ 

MSR 

Error 

n-2 

s„  — 

(SJ 

sa 

MSE 

Total 

n  -  1 

s„ 

Para  los  datos  de  la  tabla  12.1,  se  puede  calcular 
SS  Total  =  S„  =  Xy]  -  =  59816  -  =  2056 


SSR 


(1894)2 

2474 


1449.9741 


de  modo  que 

SSE  =  SS  Total  -  SSR  =  2056  -  1449.9741  =  606.0259 


y 


MSE  =  =  6Q6f259  =  75.7532 

n  —  2  8 


El  analisis  de  la  tabla  de  varianza,  parte  de  la  salida  de  regresion  lineal  generada  por 
el  MINITAB,  es  la  section  inferior  sombreada  de  la  salida  de  computadora  de  la  figura 
12.6.  Las  primeras  dos  rectas  dan  la  ecuacion  de  la  recta  de  mmimos  cuadrados,  y  =  40.8 
+  ,T66x.  Las  estimaciones  de  mmimos  cuadrados  ay  b  estan  dadas  con  mayor  precision 
en  la  columna  marcada  “Coef ’.  Se  pueden  hallar  instrucciones  para  general-  esta  salida 
impresa  en  la  section  “Mi  MINITAB”  al  final  de  este  capitulo. 
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FIGURA  1  2.6 

Salida  impresa  MINITAB 
para  los  datos  de  la  tabla 
12.1 


Regression  Analysis:  y  versus  x 


The  regression  equation  is 
y  =  40.8  +  0.766  x 


Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

40.784 

8 . 507 

4 . 79 

0 . 001 

X 

0 . 7656 

0 . 1750 

4 .38 

0 . 002 

S  =  8.70363 

R-Sq  = 

70 . 5% 

R-Sq(adj)  = 

66.8% 

Analysis  of 

Variance 

Source 

DF 

SS 

MS 

F 

P 

Regression 

1 

1450 . 0 

1450 . 0 

19 . 14 

0 . 002 

Residual  Error  8 

606 . 0 

75 . 8 

Total 

9 

2056 . 0 

CONSEJO 


Busque  a  y  b  en  la  columna 
llamada  "Coef". 


La  salida  impresa  MINITAB  tambien  da  alguna  informacion  acerca  de  la  variacion  en 
el  experimento.  Cada  una  de  las  estimaciones  de  mmimos  cuadrados,  a  y  b,  tiene  un 
error  estandar  asociado,  marcado  “SE  Coef’  en  la  figura  12.6.  Hacia  la  mitad  de  la  salida 
impresa  se  encuentra  la  mejor  estimacion  insesgada  de  a — S  =  VMSE  =  V75.7532  = 
8.70363 — ,  que  mide  el  error  residual,  la  variacion  no  explicada  o  “sobrante”  del  expe¬ 
rimento.  No  sorprendera  saber  que  las  estadisticas  t  y  F  y  sus  valores  p  hallados  en  la 
salida  impresa  se  usan  para  probar  hipotesis  estadisticas.  En  la  siguiente  seccion  expli- 
camos  estas  entradas. 


0 


E  JERCICIOS 


TECNICAS  BASICAS 

12.1  Grafique  la  recta  correspondiente  a  la  ecuacion 
y  =  2x  +  1  al  graficar  los  puntos  correspondientes  a 
x  =  0,  1  y  2.  De  el  punto  de  cruce  con  el  eje  y  y  la 
pendiente  para  la  recta. 

12.2  Grafique  la  recta  correspondiente  a  la  ecuacion 
y  =  —2x+  1  al  graficar  los  puntos  correspondientes 
a  x  =  0,  1  y  2.  De  el  punto  de  cruce  con  el  eje  y  y  la 
pendiente  para  la  recta.  7,  Como  se  relaciona  esta  recta  con 
la  recta  y  =  2x  +  1  del  ejercicio  12.1? 


observaciones.  Encuentre  las  sumas  de  cuadrados  y 
productos  cruz,  Sm  Sxy  y  Syy. 

b.  Encuentre  la  recta  de  mmimos  cuadrados  para  los 
datos. 

c.  Grafique  los  cinco  puntos  y  grafique  la  recta  del 
inciso  b).  7  La  recta  parece  ser  un  buen  ajuste  para  los 
puntos? 

d.  Construya  la  tabla  ANOVA  para  la  regresion  lineal. 

e.  Seis  puntos  tienen  estas  coordenadas: 

12.7  Encuentre  la  recta  de  mmimos  cuadrados  para  los 


1 2.3  De  la  ecuacion  y  la  grafica  para  una  recta  con 
interseccion  con  el  eje  y  igual  a  3  y  pendiente  igual  a  —  1 . 

12.4  De  la  ecuacion  y  grafica  para  una  recta  con 
interseccion  con  el  eje  y  igual  a  —  3  y  pendiente  igual  a  1 . 


datos. 


X 

1  2 

3 

4 

5 

6 

y 

5.6  4.6 

4.5 

3.7 

3.2 

2.7 

12.5  (iCual  es  la  diferencia  entre  modelos  matematicos 
deterministas  y  probabilistas? 


12.6  Se  le  dan  cinco  puntos  con  estas  coordenadas: 


x 


V 


-1 

1 


0^ 

3 


1 

5 


2 

5 


a.  Use  el  metodo  de  entrada  de  datos  en  su  calculadora 
cientifica  o  graficadora  para  introducir  las  n  =  5 


a.  Encuentre  la  recta  de  mmimos  cuadrados  para  los 
datos. 

b.  Grafique  los  seis  puntos  y  grafique  la  recta.  ^La  recta 
parece  ser  un  buen  ajuste  para  los  puntos? 

c.  Use  la  recta  de  mmimos  cuadrados  para  predecir  el 
valor  de  y  cuando  x  =  3.5. 

d.  Llene  los  espacios  faltantes  en  el  analisis  MINITAB  de 
la  tabla  de  varianza. 
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Tabla  ANOVA  MINITAB  para  el  ejercicio  12.7 

Analysis  of  Variance 

Source  DF 

Regression  * 

Residual  Error  * 

Total  * 


SS 
*  *  * 

0 . 1429 
5.5750 


MS 
5.4321 
■*■  *  * 


APLICACIONES 

12.8  Profesor  Asimov  El  profesor  Isaac  Asimov  fue 
uno  de  los  escritores  mas  prolificos  de  todos  los  tiempos. 
Antes  de  su  muerte,  escribio  casi  500  libros  durante 
una  carrera  de  40  anos.  De  hecho,  cuando  su  carrera 
avanzaba,  fue  incluso  mas  productivo  en  terminos  del 
numero  de  libros  escritos  en  un  periodo  determinado.1 
Los  datos  siguientes  dan  el  tiempo,  en  meses,  necesario 
para  escribir  sus  libros  en  incrementos  de  100: 


Numero  de  libros,  x 

100 

200 

300 

400 

490 

Tiempo  en  meses,  y 

237 

350 

419 

465 

507 

a.  Suponga  que  el  numero  de  libros  x  y  el  tiempo  en 
meses  y  estan  relacionados  linealmente.  Encuentre  la 
recta  de  minimos  cuadrados  que  relacione  y  con  x. 

b.  Grafique  el  tiempo  como  funcion  del  numero  de  libros 
escritos  usando  una  grafica  de  dispersion  y  grafique  la 
recta  de  minimos  cuadrados  en  el  mismo  papel.  i  Le 
parece  que  la  recta  da  un  buen  ajuste  a  los  puntos? 

c.  Construya  una  tabla  ANOVA  para  la  regresion  lineal. 

(^)datos  12.9  Un  experimento  quimico  Con 

el  uso  de  un  procedimiento  quimico  llamado 
polarografia  diferencial  de  pulsos ,  un  quimico  midio  la 
maxima  corriente  generada  (en  microamperes)  cuando 
una  solucion  que  contenia  una  cantidad  determinada  de 
niquel  (en  partes  por  mil  millones,  ppmm)  se  agrego  a  un 
regulador:2 

x=Ni(ppmm)  y  =  Corriente  maxima  (mA) 


19.1 

.095 

38.2 

.174 

57.3 

.256 

76.2 

.348 

95 

.429 

114 

.500 

131 

.580 

150 

.651 

170 

.722 

a.  Use  el  metodo  de  entrada  de  datos  en  su  calculadora 
para  calcular  las  sumas  de  cuadrados  preliminares  y 
productos  cruz,  Sa,  Svy  y  Sxy. 

b.  Calcule  la  recta  de  regresion  de  minimos  cuadrados. 


c.  Grafique  los  puntos  y  la  recta  ajustada.  (',Le  parece 
razonable  la  suposicion  de  una  relacion  lineal? 

d.  Use  la  recta  de  regresion  para  predecir  la  maxima 
corriente  generada  cuando  una  solucion,  que  contenga 
100  ppmm  de  niquel,  se  agregue  al  regulador. 

e.  Construya  la  tabla  ANOVA  para  la  regresion  lineal. 

12.10  Privacion  de  sueno  Se  realizo  un  estudio 
(^l  datos  para  determinar  los  efectos  de  la  privacion 
de  sueno  en  la  capacidad  de  personas  para 
resolver  problemas  cuando  no  duermen.  Un  total  de  10 
personas  participaron  en  el  estudio,  dos  en  cada  uno 
de  cinco  niveles  de  privacion  de  sueno:  8,  12,  16,  20  y 
24  horas.  Despues  del  periodo  de  privacion  de  sueno, 
a  cada  persona  se  le  aplico  un  conjunto  de  problemas 
adicionales  sencillos,  registrandose  el  numero  de  errores. 
Se  obtuvieron  estos  resultados: 


Numero  de  errores,  y 

8,6 

6, 10 

8, 14 

Numero  de  errores  sin  sueno,  x 

8 

12 

16 

Numero  de  errores,  y 

14, 12 

16, 12 

Numero  de  errores  sin  sueno,  x 

20 

24 

a.  7,  Cu  antes  pares  de  observaciones  hay  en  el 
experimento? 

b.  (iCuaI  es  el  numero  total  de  grados  de  libertad? 

c.  Complete  la  salida  impresa  MINITAB. 

Salida  impresa  MINITAB  para  el  ejercicio  12.10 

Analisis  de  regresion:  y  versus  x 

The  regression  equation  is 
y  =  3 .00  +  0.475  x 


Predictor 

Coef 

SE  Coef 

T  P 

Constant 

3 . 000 

2 . 127 

1.41  0.196 

X 

*  *  * 

0.1253 

3.79  0.005 

S  =  2.24165 

R-Sq  = 

64.2%  R-Sq(adj)  =  59.8% 

Analysis  of 

Variance 

Source 

DF 

SS  MS 

F  P 

Regression 

** 

72.200  72.200 

14.37  0.005 

Residual  Error  ** 

***  5.025 

Total 

*  * 

*** 

d.  (A'ual  es  la  ecuacion  de  prediccion  de  minimos 
cuadrados? 

e.  Use  la  ecuacion  de  prediccion  para  predecir  el  numero 
de  errores  para  una  persona  que  no  ha  dormido 
durante  10  horas. 

12.11  Examenes  de  rendimiento  Ellndice  de 
(^)  datos  Rendimiento  Academico  (API)  es  una  medida 
de  rendimiento  escolar  que  se  basa  en  los 
resultados  del  examen  Stanford  9.  Las  calificaciones 
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van  de  200  a  1000,  con  800  considerado  como  objetivo 
de  largo  alcance  para  escuelas.  La  tabla  siguiente 
muestra  el  API  para  ocho  escuelas  elementales  en  el 
condado  de  Riverside,  California,  junto  con  el  porcentaje 
de  estudiantes  de  esa  escuela  que  son  considerados 
Estudiantes  del  Idioma  Ingles  (ELL).3 

Escuela  1  2  3  4  5  6  7  8 

API  588  659  710  657  669  641  557  743 

ELL  58  22  14  30  11  26  39  6 

a.  7,Cual  de  las  dos  variables  es  la  variable  independiente 
y  cual  es  la  dependiente?  Explique  su  seleccion. 

b.  Use  una  grafica  de  dispersion  para  graficar  los  datos. 
7,La  suposicion  de  una  relacion  lineal  entre  x  y  y  es 
razonable? 

c.  Suponiendo  que  x  y  y  esten  relacionadas  linealmente, 
calcule  la  recta  de  regresion  de  mmimos  cuadrados. 

d.  Grafique  la  recta  sobre  la  grafica  de  dispersion  del 
inciso  b).  ^La  recta  ajusta  por  los  puntos? 

12.12  <jQue  tan  largo  es?  ^Que  tan  bueno  es 
( datos  usted  para  hacer  estimaciones?  Para  probar  la 

capacidad  de  una  persona  para  estimar  tamanos, 
se  le  mostraron  10  diferentes  objetos  y  se  le  pidio  estimar 
su  longitud  o  diametro.  A  continuacion  se  midio  el  objeto 
y  los  resultados  se  registraron  en  la  tabla  siguiente. 


Objeto 

Estimado  (pulgadas) 

Real  (pulg; 

Lapiz 

7.00 

6.00 

Plato  de  comida 

9.50 

10.25 

Libra  1 

7.50 

6.75 

Telefono  celular 

4.00 

4.25 

Fotografia 

14.50 

15.75 

Juguete 

3.75 

5.00 

Cinturon 

42.00 

41.50 

Pinza  para  ropa 

2.75 

3.75 

Libra  2 

10.00 

9.25 

Calculadora 

3.50 

4.75 

a.  Encuentre  la  recta  de  regresion  de  mil 

para  predecir  la  medida  real  como  funcion  de  la 
medicion  estimada. 

b.  Grafique  los  puntos  y  la  recta  ajustada.  ^Le  parece 
razonable  la  suposicion  de  una  relacion  lineal? 


12.13  Entrevistas  de  prueba  De  dos  tecnicas 
datos  existentes  para  evaluacion  de  personal,  la 

primera  requiere  una  entrevista  de  prueba  de 
dos  horas  mientras  que  la  segunda  se  puede  completar  en 
menos  de  una  hora.  Las  puntuaciones  para  cada  una  de 


las  15  personas  que  tomaron  ambas  pruebas  se  dan  en  la 
tabla  siguiente. 

Solicitante  Prueba  1  (x)  Prueba  2 (y) 


1 

75 

38 

2 

89 

56 

3 

60 

35 

4 

71 

45 

5 

92 

59 

6 

105 

70 

7 

55 

31 

8 

87 

52 

9 

73 

48 

10 

77 

41 

11 

84 

51 

12 

91 

58 

13 

75 

45 

14 

82 

49 

15 

76 

47 

a.  Construya  una  grafica  de  dispersion  para  los  datos. 
(',Le  parece  razonable  la  suposicion  de  linealidad? 

b.  Encuentre  la  recta  de  mmimos  cuadrados  para  los 
datos. 

c.  Use  la  recta  de  regresion  para  predecir  la  puntuacion 
en  la  segunda  prueba  para  un  solicitante  que  obtuvo 
85  puntos  en  la  prueba  1. 

12.14  Entrevistas  de  prueba,  continua  Consulte 
el  ejercicio  12.13.  Construya  la  tabla  ANOVA  para  la 
regresion  lineal  que  relacione  y,  la  puntuacion  en  la 
prueba  2,  con  x,  la  puntuacion  en  la  prueba  1 . 

12.15  Distancia  entre  brazos  extendidos  y 
datos  estatura  Leonardo  da  Vinci  (1452- 1519) 

dibujo  la  figura  de  un  hombre,  indicando  que 
la  distancia  entre  los  brazos  extendidos  de  una  persona 
(midiendo  por  la  espalda  con  los  brazos  extendidos 
para  formar  una  “T”)  es  casi  igual  a  la  estatura  de 
una  persona.  Para  probar  lo  dicho  por  el,  medimos  ocho 
personas  con  los  siguientes  resultados: 


Persona 

1 

2 

3 

4 

Distancia  entre  los  brazos 
extendidos  (pulgadas) 

68 

62.25 

65 

69.5 

Estatura  (pulgadas) 

69 

62 

65 

70 

Persona 

5 

6 

7 

8 

Distancia  entre  los  brazos 
extendidos  (pulgadas) 

68 

69 

62 

60.25 

Estatura  (pulgadas) 

67 

67 

63 

62 
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estatura  de  esa  persona,  ('_cual  debe  ser  la  pendiente  de 
la  recta  de  regresion? 

c.  Calcule  la  recta  de  regresion  para  predecir  la  estatura 
con  base  en  la  distancia  entre  los  brazos  extendidos  de 
una  persona.  /,EI  valor  de  la  pendiente  b  confirma  las 
conclusiones  de  usted  del  inciso  b)? 

d.  Si  una  persona  tiene  una  distancia  de  62  pulgadas 
entre  los  brazos  extendidos,  ^cual  seria  el  pronostico 
de  usted  respecto  a  la  estatura  de  la  persona? 

'(%£})  datos  12.16  :resas  Los  datos  siguientes  se 

obtuvieron  en  un  experimento  que  relacionaba 
la  variable  dependiente  y  (textura  de  fresas),  con  x 
(temperatura  codificada  de  almacenamiento). 


a.  Trace  una  grafica  de  dispersion  para  distancia  entre 
los  brazos  extendidos  y  estatura.  Use  la  misma  escala 
en  los  ejes  horizontal  y  vertical.  Describa  la  relacion 
entre  las  dos  variables. 

b.  Si  da  Vinci  estaba  en  lo  correcto  y  la  distancia  entre 
los  brazos  extendidos  de  una  persona  es  casi  igual  a  la 


X 

-2  -2 

0 

2 

2 

y 

4.0  3.5 

2.0 

0.5 

0.0 

a.  Encuentre  la  recta  de  mmimos  cuadrados  para  los 
datos. 

b  Grafique  los  puntos  y  grafique  la  recta  de  mmimos 
cuadrados  como  prueba  de  sus  calculos. 

c.  Construya  la  tabla  ANOVA. 


PRUEBA  DE  LA  UTILIDAD  DEL  MODELO 
DE  REGRESION  LINEAL 

A1  considerar  la  regresion  lineal,  uno  se  puede  hacer  dos  preguntas: 

•  i  La  variable  dependiente  x  es  util  para  predecir  la  variable  de  respuesta  v? 

•  Si  es  asf,  ^que  tan  bien  funciona? 

Esta  seccion  examina  varias  pruebas  estadisticas  y  medidas  que  le  ayudaran  a  tener  algu- 
nas  respuestas.  Una  vez  que  haya  determinado  que  el  modelo  esta  funcionando,  puede 
entonces  usarlo  para  predecir  la  respuesta  y  para  un  valor  determinado  de  x. 

Inferencias  respecto  a  /3,  la  pendiente 
de  la  recta  de  medias 

^La  recta  de  regresion  de  mmimos  cuadrados  es  util?  Es  decir,  (;la  ecuacion  de  regre¬ 
sion  que  utiliza  informacion  dada  por  x  es  sustancialmente  mejor  que  la  pronosticadora 
simple  y  que  no  se  apoya  en  x?  Si  la  variable  independiente  x  no  es  util  en  el  modelo  de 
poblacion  y  =  a  +  (3x  +  e,  entonces  el  valor  de  y  no  cambia  para  valores  diferentes 
de  x.  La  unica  forma  en  que  esto  ocurre  para  todos  los  valores  de  x  es  cuando  la  pendiente 
/ 3  de  la  recta  de  medias  es  igual  a  0.  Esto  indicarfa  que  la  relacion  entre  y  y  x  no  es  lineal, 
de  modo  que  la  pregunta  inicial  acerca  de  la  utilidad  de  la  variable  independiente  x  se 
puede  expresar  tambien  como:  ^Hay  una  relacion  entre  x  y  y? 

Se  puede  contestar  esta  pregunta  usando  ya  sea  una  prueba  de  hipotesis  o  un  intervalo 
de  confianza  para  (3.  Estos  procedimientos  estan  basados  en  la  distribucion  muestral  de 
b,  el  estimador  muestral  de  la  pendiente  (3.  Se  puede  demostrar  que,  si  las  suposiciones 
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acerca  del  error  aleatorio  e  son  validas,  entonces  el  estimador  b  tiene  una  distribucion 
normal  en  muestreo  repetido  con  media 

E(b)  =  /3 

y  error  estandar  dado  por 
SE  = 

donde  a  es  la  varianza  del  error  aleatorio  e.  Como  el  valor  de  er2  se  estima  con  s2  = 
MSE,  se  pueden  basar  inferencias  en  la  estadistica  dada  por 


que  tiene  una  distribucion  t  con  df  =  (n  —  2),  los  grados  de  libertad  asociados  con 
MSE. 


Vmse/s„ 


PRUEBA  DE  HIPOTESIS  RESPECTO  A  LA  PENDIENTE 
DE  UNA  RECTA 


1 .  Elipotesis  nula:  H0 :  (3  =  (30 

2.  Elipotesis  alternativa: 

Prueba  de  una  cola  Prueba  de  dos  colas 

:  f3  >  f3o  Ha:  [3  f30 

(o  <  Po) 

3.  Estadistica  de  prueba:  t  =  ^  = °  — 

VMSE/5^ 

Cuando  se  satisfacen  las  suposiciones  dadas  en  la  section  12.2,  la  estadistica  de 
prueba  tendra  una  distribucion  1  de  Student  con  (n  —  2)  grados  de  libertad. 

4.  Region  de  rechazo:  rechazar  H0  cuando 


Prueba  de  una  cola  Prueba  de  dos  colas 

t  >  ta  t  >  C/2  o  t  <  —t^i 

(o  t  <  ~ta  cuando  la  hipotesis 
alternativa  sea  //a :  /3  <  /30) 

o  cuando  valor  p  <  a 


Los  valores  de  ta  y  t„n  se  pueden  hallar  usando  la  tabla  4  del  apendice  I  o  el  applet  t 
Probabilities.  Use  los  valores  de  t  correspondientes  a  (n  —  2)  grados  de  libertad. 
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Determine  si  hay  una  relation  lineal  significativa  entre  las  calificaciones  en  calculo  y  las 
puntuaciones  de  examen  de  la  tabla  12.1.  Pruebe  al  nivel  de  signibcancia  de  5%. 

Solution  Las  hipotesis  a  probar  son 

H0 :  /3  =  0  contra  Hd\  (i  +  0 

y  el  valor  observado  de  la  estadistica  de  prueba  se  calcula  como 


b-  0  .7656  -  0 

VMSE/S„  V75.7532/2474 


con  ( n  —  2)  =  8  grados  de  libertad.  Con  a  =  .05,  se  puede  rechazar  H0  cuando  t  >  2.306 
o  t  <  —2.306.  Como  el  valor  observado  de  la  estadistica  de  prueba  cae  en  la  region  de 
rechazo,  H0  es  rechazada  y  se  puede  concluir  que  hay  una  relation  lineal  signibcativa 
entre  las  calibcaciones  en  calculo  y  la  puntuacion  de  examen  para  la  poblacion  de  estu- 
diantes  de  primer  ano  de  universidad. 


Se  puede  usar  el  applet  f-Test  for  the  Slope  que  se  ve  en  la  bgura  12.7  para  hallar 
valores  p  o  regiones  de  rechazo  para  esta  prueba.  Primero  se  debe  calcular  el  error 
estandar  SE  =\/MSE/.SjA,  teclear  su  valor  en  la  caja  marcada  “Std  Error”,  y  presionar 
“Enter”. 


FIGURA  12.7 

Applet  f-Testforthe 
Slope 


•  Si  se  introduce  el  valor  de  b  en  la  formula  en  la  parte  superior  del  applet  y  se 
presiona  “Enter”,  el  applet  calculara  la  estadistica  de  prueba  y  su  valor  p  de  una 
o  de  dos  colas. 

•  Si  se  introduce  el  nivel  de  signibcancia  a  en  la  caja  marcada  “prob:”  y  se  selec- 
ciona  la  option  “Area  to  the  Right”  o  “Two  Tails”  de  la  lista  descendente,  el 
applet  calculara  el  valor  positivo  de  t  necesario  para  rechazar  H0.  (Tambien  se 
puede  usar  el  applet  Student’s  t  Probabilities  para  hallar  los  valores  criticos.) 

(  Cual  es  el  valor  p  para  la  prueba  efectuada  en  el  ejemplo  12.2?  ,\Este  valor  p  con- 
hrma  nuestras  conclusiones? 


Otra  forma  de  hacer  inferencias  acerca  del  valor  de  /3  es  construir  un  intervalo  de 
conbanza  para  /3  y  examinar  el  rango  de  posibles  valores  para  (3. 
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UN  INTERVALO  DE  CONFIANZA  (1  -  a)  100%  PARA  /S 


b  ±  tal2( SE) 

donde  taP_  esta  basada  en  (n  —  2)  grados  de  libertad  y 


Encuentre  una  estimation  de  intervalo  de  confianza  de  95%  de  la  pendiente  [3  para  los 
datos  de  las  calificaciones  en  calculo  de  la  tabla  12.1. 

Solucion  Sustituyendo  valores  previamente  calculados  en 


b  ±  t  n 


M.S'E 


tendremos 

.766  ±  2.306  J^532 


.766  ±  .404 


El  intervalo  de  confianza  de  95%  resultante  es  .362  a  1.170.  Como  el  intervalo  no  con- 
tiene  0,  se  puede  concluir  que  el  verdadero  valor  de  [3  no  es  0  y  se  puede  rechazar  la 
hipotesis  nula  H0  :  (3  =  0  a  favor  de  //a  :  (3  A  0,  conclusion  que  esta  de  acuerdo  con 
los  hallazgos  del  ejemplo  12.2.  Ademas,  la  estimation  del  intervalo  de  confianza  indica 
que  hay  un  aumento  desde  solo  .4  hasta  1.2  puntos  en  una  puntuacion  de  examen  de 
calculo  por  cada  aumento  de  1  punto  en  la  puntuacion  del  examen  de  aprovechamiento. 


Si  usted  utiliza  un  programa  de  computo  para  hacer  un  analisis  de  regresion,  encon- 
trara  la  estadfstica  t  y  su  valor  p  en  la  salida  impresa.  Observe  la  salida  impresa  MINITAB 
del  analisis  de  regresion  que  se  reproduce  en  la  figura  12.8.  En  la  segunda  parte  de  la 
salida  impresa,  encontrara  las  estimaciones  de  mfnimos  cuadrados  a  (“Constante”)  y  b 
(“x”)  en  la  columna  marcada  “Coef sus  errores  estandar  (“SE  Coef ’),  el  valor  calcu- 
lado  de  la  estadfstica  t  (“T”)  empleada  para  probar  la  hipotesis  de  que  el  parametro  es 
igual  a  0  y  su  valor  p  (“P”).  La  prueba  t  para  regresion  significativa,  H0  :  (3  =  0,  tiene 
un  valor  p  de  P  =  .002  y  la  hipotesis  nula  es  rechazada,  como  en  el  ejemplo  12.2.  ^Esto 
concuerda  con  el  valor  p  hallado  usando  el  applet  f-Test  for  Slope  de  la  figura  12.7?  En 
cualquier  caso,  hay  una  relation  lineal  significativa  entre  x  y  y. 


FIGURA  12.8 

Salida  impresa  MINITAB 
para  los  datos  de 
calificaciones  en  calculo 


CONSEJO 


Busque  el  error  estandar  de 
b  en  la  columna  marcada 
"SE  Coef". 


Analisis  de  regresion:  y  versus  x 


The  regression  equation  is 
y  =  40.8  +  0.766  x 


Predictor 

Constant 

x 


Coef  SE  Coef 
40.784  8.507 
0.7656  0.1750 


T  P 
4.79  0.001 
4.38  0.002 


S  =  8.70363 


R-Sq  =  70.5%  R-Sq(adj)  =  66.8% 


Analysis  of  Variance 


Source  DF 
Regression  1 
Residual  Error  8 
Total  9 


SS  MS  F 

1450.0  1450.0  19.14 

606.0  75.8 

2056 . 0 


P 

0 . 002 
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Las  pruebas  Fde  ANOVA 
siempre  son  de  una  cola  (cola 
superior). 


El  analisis  de  varianza  de  la  prueba  F 

La  parte  del  analisis  de  varianza  de  la  salida  impresa  de  la  figura  12.8  muestra  una  esta- 
distica  F  dada  por 


,  MSR 
MSE 


19.14 


con  grado  de  libertad  1  en  el  numerador  y  (n  —  2)  =  8  grados  de  libertad  en  el  deno- 
minador.  Esto  es  una  estadistica  equivalente  de  prueba  que  tambien  se  puede  usar  para 
probar  la  hipotesis  H0 :  (3  =  0.  Observe  que,  dentro  del  error  de  redondeo,  el  valor  de  F 
es  igual  a  t2  con  valor  p  identico.  En  este  caso,  si  se  usa  una  precision  de  cinco  lugares 
decimales  antes  de  redondeo,  se  encuentra  que  t2  =  (.76556/.  17498)2  =  (4.37513)2  = 
19.14175  ~  19.14  =  Fcomo  se  da  en  la  salida  impresa.  Esto  no  es  por  casualidad  y  re- 
sulta  del  hecho  de  que  el  cuadrado  de  una  estadistica  t  con  df  grados  de  libertad  tiene  la 
misma  distribucion  que  una  estadistica  F  con  grados  de  libertad  1  en  el  numerador  y  df 
en  el  denominador.  La  prueba  F  es  una  prueba  mas  general  de  la  utilidad  del  modelo  y 
se  puede  usar  cuando  el  modelo  tenga  mas  de  una  variable  independiente. 


En  las  salidas  impresas  de 
computadora,  i2  a  menudo 
es  dado  como  un  porcentaje 
mas  que  como  una 
proporcion. 


Medir  la  fuerza  de  la  relacion:  el  coeficiente 
de  determinacion 

(■  Que  tan  bien  se  ajusta  el  modelo  de  regresion?  Para  contestar  esta  pregunta,  se  puede 
usar  una  medida  relacionada  con  el  coeficiente  de  correlacion  r,  introducido  en  el  capi- 
tulo  3.  Recuerde  que 


$xy  Vcv 

^  \/SXXSyy 


para  —  1  <  r  <  1 


donde  sxy,  sx  y  sv  se  definieron  en  el  capitulo  3  y  las  diversas  sumas  de  cuadrados  se  defi- 
nieron  en  la  seccion  12.4. 

La  suma  de  cuadrados  para  regresion,  SSR,  en  el  analisis  de  varianza,  mide  la  parte 
de  la  variacion  total  SS  Total  =  Syy,  que  puede  ser  explicada  por  la  regresion  de  y  en  x. 
La  parte  restante,  SSE,  es  la  variacion  “no  explicada”  atribuida  al  error  aleatorio.  Una 
forma  de  medir  la  fuerza  de  la  relacion  entre  la  variable  de  respuesta  v  y  la  variable 
de  prediction  x  es  calcular  el  coeficiente  de  determinacion,  la  proporcion  de  la  varia¬ 
cion  total  que  es  explicada  por  la  regresion  de  y  en  x.  Para  los  datos  de  calificaciones  en 
calculo,  esta  proporcion  es  igual  a 


SSR 
SS  Total 


=  -705  o  70.5% 

2056 


(5v) 

Puesto  que  SS  =  Syy  y  SSR  =  ,  se  puede  escribir 

^xx 

SSR  =  0 
SS  Total  SxxSyy 


Por  tanto,  el  coeficiente  de  determinacion,  que  fue  calculado  como  SSR/SS  Total,  es 
simplemente  el  cuadrado  del  coeficiente  de  correlacion  r.  Es  la  entrada  marcada  “R-Sq” 
en  la  figura  12.8. 

Recuerde  que  la  tabla  del  analisis  de  varianza  afsla  la  variacion  debida  a  regresion 
(SSR)  de  la  variacion  total  del  experimento.  Al  hacer  esto  se  reduce  la  cantidad  de  varia¬ 
cion  aleatoria  del  experimento,  ahora  medida  por  SSE  en  lugar  de  SS  Total.  En  este 
contexto,  el  coeficiente  de  determinacion,  r2,  se  puede  definir  como  sigue: 
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CONSEJO 


i2  se  denomina  "R-Sq"  en  la 
salida  impresa  MINITAB. 


Definicion  El  coeficiente  de  determination  r  se  puede  interpretar  como  el  por- 
centaje  de  reduction  en  la  variation  total  en  el  experimento  obtenido  al  usar  la  recta  de 
regresion  y  =  a  +  bx.  en  lugar  de  ignorar  x  y  usar  la  media  muestral  y  para  predecir  la 
variable  de  respuesta  y. 


Para  los  datos  de  calificaciones  en  calculo,  una  reduction  de  r  =  .705  o  sea  70.5%  es 
sustancial.  El  modelo  de  regresion  esta  funcionando  muy  bien. 

Interpretation  de  los  resultados 
de  una  regresion  significativa 

Una  vez  que  usted  haya  efectuado  la  prueba  t  o  la  prueba  F  para  determinar  la  significan- 
cia  de  la  regresion  lineal,  con  todo  cuidado  debe  interpretar  sus  resultados.  La  pendiente 
(3  de  la  recta  de  medias  se  estima  con  base  en  datos  de  solo  una  region  de  observation 
en  particular.  Incluso  si  no  rechaza  la  hipotesis  nula  de  que  la  pendiente  de  la  recta  es 
igual  a  0,  no  necesariamente  significa  que  y  y  x  no  esten  relacionadas.  Puede  ser  que 
haya  cometido  un  error  tipo  II,  declarando  falsamente  que  la  pendiente  es  0  y  que  x  y 
y  no  estan  relacionadas. 

Ajuste  del  modelo  erroneo 

Puede  ocurrir  que  yyx  esten  perfectamente  relacionadas  en  una  forma  no  lineal,  como 
se  ve  en  la  figura  12.9.  A  continuation  veamos  tres  posibilidades: 


•  Si  se  tomaron  observations  solo  dentro  del  intervalo  b  <  x  <  c,  la  relation  apa- 
recerfa  lineal  con  pendiente  positiva. 

•  Si  se  tomaron  observaciones  solo  dentro  del  intervalo  d  <  x  <  f  la  relation  apa- 
recerfa  lineal  con  pendiente  negativa. 

•  Si  se  tomaron  observaciones  sobre  el  intervalo  c  <  x  <  d,  la  recta  estarfa  ajus- 
tada  con  una  pendiente  cercana  a  0,  lo  cual  indica  que  no  hay  relation  lineal 
entre  y  y  x. 

Para  el  ejemplo  que  se  ilustra  en  la  figura  12.9,  ninguna  recta  describe  con  precision 
la  verdadera  relation  entre  xy  y,  que  es  en  realidad  una  relation  no  curvilmea.  En  este 
caso,  hemos  escogido  un  modelo  erroneo  para  describir  la  relation.  A  veces  este  tipo  de 
error  se  puede  detectar  usando  graficas  residuales,  que  es  el  tema  de  la  section  12.7. 

Extrapolation 

Un  problema  serio  es  aplicar  los  resultados  de  un  analisis  de  regresion  lineal  a  valores 
de  x  que  no  esten  incluidos  dentro  del  rango  de  los  datos  ajustados.  Esto  se  llama  extra¬ 
polation  y  puede  llevar  a  errores  graves  en  la  prediction,  como  se  ve  para  la  linea  1  de 
la  figura  12.9. 


Es  peligroso  tratar  de 
predecir  valores  de  y fuera 
del  rango  de  los  datos 
ajustados. 
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Los  resultados  de  una  prediccion  serfan  buenos  en  el  intervalo  b  <  x  <  c  pero  sobrees- 
timarian  gravemente  los  valores  de  y  para  x>  c. 

Causalidad 

Cuando  haya  una  regresion  significativa  de  y  y  x,  es  tentador  concluir  que  x  causa  a  y. 
No  obstante,  es  posible  que  una  o  mas  variables  desconocidas  que  ni  siquiera  se  hayan 
medido  y  que  no  esten  incluidas  en  el  analisis  puedan  estar  causando  la  relacion  obser- 
vada.  En  general,  el  estadfstico  informa  los  resultados  de  un  analisis  pero  deja  las  con- 
clusiones  respecto  a  la  causalidad  a  cientificos  e  investigadores  que  son  expertos  en 
estos  campos  de  actividad.  Estos  expertos  estan  mejor  preparados  para  tomar  esas  deci- 
siones. 


© 


EJERCICIOS 


TECNICAS  BASICAS 


12.17  Consulte  el  ejercicio  12.6.  Los  datos  se 
reproducen  a  continuacion. 


x 

V 


-A 

1 


0^ 

3 


] 

5 


2 

5 


informacion  de  la  salida  impresa  MINITAB  para 
contestar  esta  pregunta  al  nivel  de  significancia 
de  1%. 

b.  Calcule  el  coeficiente  de  determination  r2.  (',Que 
informacion  da  este  valor  acerca  de  la  utilidad  del 
modelo  lineal? 


a.  ^Los  datos  presentan  suficiente  evidencia  para  indicar 
que  yyx  estan  relacionadas  linealmente?  Pruebe  la 
hipotesis  de  que  /S  =  0  al  nivel  de  significancia  de  5%. 

b.  Use  la  tabla  ANOVA  del  ejercicio  12.6  para  calcular 
F  =  MSR/MSE.  Verifique  que  el  cuadrado  de  la 
estadfstica  t  empleada  en  la  parte  a)  es  igual  a  F. 

c.  Compare  el  valor  crftico  de  dos  colas  para  la  prueba  1 
del  inciso  a)  con  el  valor  crftico  para  F  con  a  =  .05. 
(',Cual  es  la  relacion  entre  los  valores  crfticos? 

12.18  Consulte  el  ejercicio  12.17.  Encuentre  un 
intervalo  de  confianza  para  la  pendiente  de  la  recta.  ^Que 
significa  la  frase  “95%  de  confianza”? 

12.19  Consulte  el  ejercicio  12.7.  Los  datos,  junto  con  el 
analisis  MINITAB  de  la  tabla  de  varianza  se  reproducen  a 
continuacion. 


X 

1  2 

3 

4 

5 

6 

y 

5.6  4.6 

4.5 

3.7 

3.2 

2.7 

Tabla  MINITAB  MiOMA  para  el  ejercicio  12.19 

Analisis  de  regresion:  y  versus  x 

Analysis  of  Variance 

Source  DF  SS  MS  F  P 

Regression  1  5.4321  5.4321  152.10  0.000 

Residual  Error  4  0.1429  0.0357 

Total  5  5.5750 

a.  i,Los  datos  dan  suficiente  evidencia  para  indicar 
que  yyx  estan  relacionados  linealmente?  Use  la 


APLICACIONES 

datos  12.20  Contaminacion  del  aire  Sediseno 
un  experimento  para  comparar  varios  tipos 
diferentes  de  monitores  de  la  contaminacion  del  aire.4  Un 
monitor  se  inicio  y  a  continuacion  se  expuso  a  diferentes 
concentraciones  de  ozono,  que  iban  de  15  a  230  partes 
por  millon  (ppm)  durante  periodos  de  8  a  72  horas.  Los 
filtros  del  monitor  se  analizaron  en  seguida  y  se  midio 
la  cantidad  (en  microgramos)  de  nitrato  de  sodio  (N03) 
registrada  por  el  monitor.  Los  resultados  para  un  tipo  de 
monitor  se  dan  en  la  tabla  siguiente. 


Ozono,  x(ppm/h) 

.8  1.3 

1.7 

2.2 

2.7 

2.9 

N03,  y(yug) 

2.44  5.21 

6.07 

8.98 

10.82 

12.16 

a.  Encuentre  la  recta  de  regresion  de  mfnimos 
cuadrados  que  relacione  la  respuesta  del  monitor 
a  la  concentracion  de  ozono. 

b.  (:,Los  datos  dan  suficiente  evidencia  para  indicar  que 
hay  una  relacion  lineal  entre  la  concentracion  de 
ozono  y  la  cantidad  de  nitrato  de  sodio  detectada? 

c.  Calcule  r1.  ^Que  nos  dice  este  valor  acerca  de  la 
efectividad  del  analisis  de  regresion  lineal? 

(^)datos  12.21  El  costo  de  volar  ^.Corno  esta 
relacionado  el  costo  de  un  viaje  en  avion 
con  la  duration  del  viaje?  La  tabla  siguiente  muestra 
el  promedio  de  la  tarifa  en  primera  clase,  pagada  por 
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clientes  de  American  Airlines  en  cada  una  de  las  18  rutas 
aereas  de  mayor  movimiento  en  Estados  Unidos.5 


Ruta 

Distancia 

(millas) 

Costo 

Dallas— Austin 

178 

$125 

Houston-Dallas 

232 

123 

Chicago— Detroit 

238 

148 

Chicago-San  Luis 

262 

136 

Chicago— Cleveland 

301 

129 

Chicago— Atlanta 

593 

162 

Nueva  York-Miami 

1092 

224 

Nueva  York-San  Juan 

1608 

264 

Nueva  York-Chicago 

714 

287 

Chicago-Denver 

901 

256 

Dallas-Salt  Lake 

1005 

365 

Nueva  York— Dallas 

1374 

459 

Chicago-Seattle 

1736 

424 

Los  Angeles-Chicago 

1757 

361 

Los  Angeles-Atlanta 

1946 

309 

Nueva  York-Los  Angeles 

2463 

444 

Los  Angeles-Honolulu 

2556 

323 

Nueva  York-San  Francisco 

2574 

513 

a.  Si  usted  desea  estimar  el  costo  de  un  vuelo,  basado 
en  la  distancia  recorrida,  ^cual  variable  es  la  variable 
de  respuesta  y  cual  es  la  variable  independiente  de 
prediccion? 

b.  Suponga  que  hay  una  relacion  lineal  entre  costo  y 
distancia.  Calcule  la  recta  de  regresion  de  mmimos 
cuadrados  que  describa  el  costo  como  una  funcion 
lineal  de  la  distancia. 

c.  Grafique  los  puntos  y  la  recta  de  regresion.  ^Lc  parece 
que  la  recta  ajusta  los  datos? 

d.  Use  las  pruebas  estadrsticas  y  medidas  apropiadas 
para  explicar  la  utilidad  del  modelo  de  regresion  para 
predecir  el  costo. 

12.22  Profesor  Asimov,  continua  Consulte  los 
datos  del  ejercicio  12.8,  que  relacionan  x,  el  numero 
de  libros  escritos  por  el  profesor  Isaac  Asimov,  con 
y,  el  numero  de  meses  que  le  tomo  escribir  sus  libros 
(en  incrementos  de  100).  Los  datos  se  reproducen  a 
continuacion. 


Numero  de  libros,  x 

100 

200 

300 

400 

490 

Tiempo  en  meses,  y 

237 

350 

419 

465 

507 

a.  7,  Los  datos  apoyan  la  hipotesis  de  que  /3  =  0?  Use 
el  metodo  del  valor  p,  enlazando  el  valor  p  usando 
la  tabla  4  del  apendice  I  o  hallando  el  valor  p  exacto 
usando  el  applet  /-Test  for  the  Slope.  Explique  sus 
conclusiones  en  terminos  practicos. 

b.  Use  la  tabla  ANOVA  del  ejercicio  12.8,  inciso  c), 
para  calcular  el  coeficiente  de  determinacion  r2. 

7  Que  reduccion  de  porcentaje  en  la  variacion  total 
se  alcanza  usando  el  modelo  de  regresion  lineal? 


c.  Grafique  los  datos  o  consulte  la  grafica  del  ejercicio 
12.8,  inciso  b).  ^Los  resultados  de  los  incisos  a)  y 
b)  indican  que  el  modelo  da  un  buen  ajuste  para  los 
datos?  7  Hay  algunas  suposiciones  que  pueden  haber 
sido  violadas  al  ajustar  el  modelo  lineal? 

12.23  Consulte  el  experimento  de  privacion  de  sueno 
descrito  en  el  ejercicio  12.10  y  el  conjunto  de  datos 
EX1210.  Los  datos  y  la  salida  impresa  MINITAB  se 
reproducen  a  continuacion. 


Numero  de  errores,  y 

8,6 

6, 10 

8, 14 

Numero  de  horas  sin  sueno,  x 

8 

12  16 

Numero  de  errores,  y 

14, 12 

16, 12 

Numero  de  horas  sin  sueno,  x 

20 

24 

Salida  impresa  MINITAB  para  el  ejercicio  12.23 

Analisis  de  regresion:  y  versus  x 


The  regression  equation  is 
y  =  3.00  +  0.475  x 


Predictor 

Constant 

x 


Coef  SE  Coef 
3.000  2.127 

0.4750  0.1253 


T  P 
1.41  0.196 
3.79  0.005 


S  =  2.24165  R-Sq  =  64.2%  R-Sq(adj)  =  59.8% 
Analysis  of  Variance 


Source  DF 
Regression  1 
Residual  Error  8 
Total  9 


SS  MS  F  P 

72.200  72.200  14.37  0.005 

40.200  5.025 
112.400 


a.  7L0S  datos  presentan  suficiente  evidencia  para  indicar 
que  el  numero  de  errores  esta  linealmente  relaciona- 
do  con  el  numero  de  horas  sin  sueno?  Identifique 

las  dos  estadlsticas  de  prueba  en  la  salida  impresa  que 
puedan  usarse  para  contestar  esta  pregunta. 

b.  (-.Esperarfa  usted  que  la  relacion  entre  yyx  sea  lineal 
si  x  vario  en  un  rango  mas  amplio  (por  ejemplo,  x  =  4 
ax  =  48)? 

c.  (.Como  describe  la  fuerza  de  la  relacion  entre  yyxl 

d.  7  C  util  es  la  mejor  estimacion  de  la  variacion 
poblacional  comun  cr? 

e.  Encuentre  un  intervalo  de  confianza  de  95%  para  la 
pendiente  de  la  recta. 

12.24  'resas  II  Los  datos  siguientes  (ejercicio 
12.16  y  conjunto  de  datos  EX1216)  se  obtuvieron  en  un 
experimento  que  relacionaba  la  variable  dependiente,  y 
(textura  de  fresas),  con  x  (temperatura  de  almacenamiento 
codificada).  Use  la  informacion  del  ejercicio  12.16  para 
contestar  las  preguntas  siguientes: 


X 

CNJ 

1 

CNI 

1 

0 

2 

2 

y 

4.0  3.5 

2.0 

0.5 

0.0 

a.  ^Cual  es  la  mejor  estimacion  de  cr2,  la  varianza  del 
error  aleatorio  si 
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b.  ^Los  datos  indican  que  la  textura  y  la  temperatura  de 
almacenamiento  estan  relacionadas  linealmente?  Use 
a  =  .05. 

c.  Calcule  el  coeficiente  de  determinacion,  r. 

d.  ^De  que  valor  es  el  modelo  lineal  para  aumentar  la 
precision  de  prediccion  cuando  se  compara  con 

la  variable  de  prediccion  yl 

(^)datos  12.25  Laptops  y  aprendizaje  En  el  ejercicio 
1.61  describimos  un  experimento  informal 
realizado  en  la  Secundaria  Academica  McNair  en  Jersey 
City,  Nueva  Jersey.  Se  estudiaron  dos  grupos  de  primer 
ano  de  algebra,  uno  de  los  cuales  utilizaba  computadoras 
laptop  en  la  escuela  y  en  casa,  en  tanto  que  el  otro  grupo 
no  las  utilizaba.  En  cada  grupo,  a  los  estudiantes  se  les  dio 
una  encuesta  al  principio  y  al  final  del  semestre,  que  media 
su  nivel  tecnologico.  Se  registraron  las  calificaciones  para 
la  encuesta  del  final  de  semestre  ( x )  y  el  examen  final  (y) 
para  el  grupo  con  laptop.6  Los  datos  y  la  salida  impresa 
MINITAB  se  muestran  aqui. 


Estudiante 

Despues 
de  examen 

Examen 

final 

Despues 

Estudiante  de  examen 

Examen 

final 

1 

100 

98 

11 

88 

84 

2 

96 

97 

12 

92 

93 

3 

88 

88 

13 

68 

57 

4 

100 

100 

14 

84 

84 

5 

100 

100 

15 

84 

81 

6 

96 

•"J 

CO 

16 

88 

83 

7 

80 

68 

17 

72 

84 

8 

68 

47 

18 

88 

93 

9 

92 

90 

19 

72 

57 

10 

96 

94 

20 

88 

83 

b.  (Cual  es  la  ecuacion  de  la  recta  de  regresion  empleada 
para  predecir  la  calificacion  del  examen  final  como 
funcion  de  la  calificacion  antes  del  examen? 

c.  (',Los  datos  presentan  suficiente  evidencia  para  indicar 
que  la  calificacion  del  examen  final  esta  linealmente 
relacionada  con  la  calificacion  despues  del  examen? 
Use  a  =  .01. 

d.  Encuentre  un  intervalo  de  confianza  de  99%  para  la 
pendiente  de  la  recta  de  regresion. 

12.26  Laptops  y  aprendizaje,  continua  Consulteel 
ejercicio  12.25. 

a.  Use  la  salida  impresa  MINITAB  para  hallar  el  valor  del 
coeficiente  de  determinacion,  r2.  Demuestre  que  r2  = 
SSR/SS  Total. 

b.  (iQue  reduccion  de  porcentaje  en  la  variation  total  se 
obtiene  al  usar  el  modelo  de  regresion  lineal? 

12.27  Distancia  entre  brazos  extendidos  y 
estatura  II  En  el  ejercicio  12.15  (conjunto  de  datos 
EX1215),  medimos  la  distancia  entre  brazos  extendidos  y 
estatura  de  ocho  personas  con  los  siguientes  resultados: 


Persona 

1 

2 

3 

4 

Distancia  entre  brazos 
extendidos  (pulgadas) 

68 

62.25 

65 

69.5 

Estatura  (pulgadas) 

69 

62 

65 

70 

Persona 

5 

6 

7 

8 

Distancia  entre  brazos 
extendidos  (pulgadas) 

68 

69 

62 

60.25 

Estatura  (pulgadas) 

67 

67 

63 

62 

Analisis  de  regresion:  y  versus  x 

a. 

The  regression  equation  is 
y  =  -26.8  +  1.26  x 

Predictor  Coef 
Constant  -26.82 
x  1.2617 

SE  Coef 
14 . 76 

0 . 1685 

T 

-1 . 82 
7.49 

P 

0 . 086 

0 . 000 

b. 

S  =  7.61912  R-Sq  = 

75.7%  R 

-Sq (adj ) 

=  74.3% 

Analysis  of  Variance 
Source  DF 
Regression  1 
Residual  Error  18 
Total  19 

SS 

3254 . 0 
1044 . 9 
4299 . 0 

MS 
3254 . 0 
58 . 1 

F  P 

56.05  0.000 

c. 

(,Los  datos  dan  suficiente  evidencia  para  indicar  que 
hay  una  relacion  lineal  entre  distancia  y  estatura? 
Pruebe  al  nivel  de  significancia  de  5%. 

Construya  un  intervalo  de  confianza  de  95%  para  la 
pendiente  de  la  recta  de  medias,  (3. 

Si  Leonardo  da  Vinci  tenia  razon  y  la  distancia  entre 
los  brazos  extendidos  de  una  persona  es  casi  igual  a 
la  estatura  de  esa  persona,  la  pendiente  de  la  recta  de 
regresion  es  aproximadamente  igual  a  1 .  (,E1  intervalo 


a.  Construya  una  grafica  de  dispersion  para  los  datos. 


de  confianza  construido  en  el  inciso  b)  confirma  esta 


(,  Le  parece  razonable  la  suposicion  de  linealidad? 


suposicion?  Explique. 


HERRAMIENTAS  DE  DIAGNOSTICO 
PARA  VERIFICAR  SUPOSICIONES 
DE  LA  REGRESION 

Aun  cuando  ya  hemos  determinado,  con  el  uso  de  la  prueba  t  para  la  pendiente  (o  la 
prueba  F  ANOVA)  y  el  valor  de  r2,  que  x  es  util  para  predecir  el  valor  de  y,  los  resulta¬ 
dos  de  un  analisis  de  regresion  son  validos  solo  cuando  los  datos  satisfacen  las  suposi- 
ciones  de  regresion  necesarias. 
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SUPOSICIONES  DE  REGRESION 

•  La  relation  entre  yyx  debe  ser  lineal,  dada  por  el  modelo 

y  =  a  +  fix  +  e 

•  Los  valores  del  termino  de  error  aleatorio  e:  1)  son  independientes,  2)  tienen  una 
media  de  0  y  una  varianza  comiin  cr2,  independiente  de  x,  y  3)  estan  normalmente 
distribuidos. 

Como  estas  suposiciones  son  bastante  similares  a  las  presentadas  en  el  capitulo  1 1  para 
un  analisis  de  varianza,  no  debe  sorprender  hallar  que  las  herramientas  de  diagnostico 
para  verificar  estas  suposiciones  son  las  mismas  que  las  que  empleamos  en  ese  capitulo. 
Estas  herramientas  incluyen  el  analisis  del  error  residual,  la  variation  no  explicada  en 
cada  observation  una  vez  que  la  variation  explicada  por  el  modelo  de  regresion  se  haya 
eliminado. 

Terminos  de  error  dependientes 

Es  frecuente  que  los  terminos  de  error  sean  dependientes  cuando  las  observaciones  se 
recolectan  a  intervalos  de  tiempo  regulares.  Cuando  este  es  el  caso,  las  observaciones 
forman  una  serie  de  tiempo  cuyos  terminos  de  error  estan  correlacionados.  Esto,  a  su 
vez,  causa  un  sesgo  en  las  estimaciones  de  parametros  de  modelo.  Los  datos  de  la  serie 
de  tiempo  deben  ser  analizados  usando  metodos  de  serie  de  tiempo.  Una  explication  del 
analisis  de  una  serie  de  tiempo  se  encuentra  en  el  texto  Statistics  for  Management  and 
Economics,  7a  edition,  de  Mendenhall,  Beaver  y  Beaver. 

Graficas  residuales 

Las  otras  suposiciones  de  regresion  se  pueden  verificar  con  el  uso  de  graficas  residua¬ 
les,  que  son  bastante  complicadas  de  hacer  manualmente  pero  faciles  si  se  grafican  en 
computadora. 

En  regresion  lineal  simple,  se  puede  usar  la  grafica  de  residuales  contra  ajuste  para 
verificar  una  varianza  constante  asf  como  asegurarse  que  el  modelo  lineal  en  verdad  sea 
adecuado.  Esta  grafica  debe  estar  fibre  de  modelos  y  aparecer  como  dispersion  aleatoria 
de  puntos  alrededor  de  0  en  el  eje  vertical,  con  aproximadamente  la  misma  dispersion 
vertical  para  todos  los  valores  de  y.  Una  propiedad  de  los  residuales  es  que  suman  0 
y,  por  tanto,  tienen  una  media  muestral  de  0.  La  grafica  de  los  residuales  versus  ajuste 
para  el  ejemplo  de  las  calificaciones  en  calculo  se  ve  en  la  figura  12.10.  No  hay  modelos 
aparentes  en  esta  grafica  residual,  lo  cual  indica  que  las  suposiciones  del  modelo  parecen 
estar  satisfechas  para  estos  datos. 


FIGURA  12.10 

Grafica  de  los  residuales 
contra  y  para  el  ejemplo 
12.1 


Residuales  contra  valor  ajustado 

(la  respuesta  es  y) 


Valor  ajustado 
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Residuales  versus  ajustes  <s> 
dispersion  aleatoria. 

Grafica  normal  <s>  linea  recta, 
pendiente  ascendente. 


Recuerde  del  capitulo  1 1  que  la  grafica  normal  de  probabilidad  es  una  grafica  que 
traza  los  residuales  contra  el  valor  esperado  del  residual  si  hubiera  venido  de  una  distri¬ 
bucion  normal.  Cuando  los  residuales  esten  distribuidos  normalmente  o  que  en  forma 
aproximada  esten  asf  distribuidos,  la  grafica  debe  aparecer  como  una  recta  con  pendiente 
hacia  arriba.  La  grafica  normal  de  probabilidad  para  los  residuales  del  ejemplo  12.1  esta 
en  la  figura  12.1 1.  Con  la  excepcion  de  los  puntos  graficados  cuarto  y  quinto,  los  puntos 
restantes  parecen  estar  casi  sobre  la  recta.  Esta  grafica  no  es  rara  y  no  indica  anormalidad 
fundamental.  Las  violaciones  mas  serias  de  la  suposicion  de  normalidad  por  lo  gene¬ 
ral  aparecen  en  las  colas  de  la  distribucion  porque  aquf  es  donde  la  distribucion  normal 
difiere  de  la  mayor  parte  de  otros  tipos  de  distribuciones  con  media  y  medida  de  disper¬ 
sion  similares.  En  consecuencia,  la  curvatura  en  cualquiera  de  los  extremos  o  en  ambos 
de  la  grafica  normal  de  probabilidad  indica  no  normalidad. 


EJERCICIOS 


TECNICAS  BASICAS 

12.28  ^Cual  grafica  de  diagnostico  se  puede  usar 
para  determinar  si  los  datos  satisfacen  la  suposicion  de 
normalidad?  (Como  se  vena  la  grafica  para  residuales 
normales? 

12.29  (',Cual  grafica  de  diagnostico  se  puede  usar  para 
determinar  si  se  ha  usado  el  modelo  incorrecto?  (jC6mo 
se  verfa  la  grafica  si  se  ha  usado  el  modelo  incorrecto? 

12.30  ^Cual  grafica  de  diagnostico  se  puede  usar 
para  determinar  si  se  ha  violado  la  suposicion  de  igual 
varianza?  ^Como  se  verfa  la  grafica  cuando  las  varianzas 
son  iguales  para  todos  los  valores  de  x? 

12.31  Consulte  los  datos  del  ejercicio  12.7.  La  grafica 
normal  de  probabilidad  y  las  graficas  de  residuales  contra 
valores  ajustados  generadas  por  MINITAB  se  muestran  a 


continuation.  ^Le  parece  que  alguna  de  las  suposiciones 
de  regresion  ha  sido  violada?  Explique. 

Salida  impresa  MINITAB  para  el  ejercicio  12.31 


Grafica  normal  de  probabilidad  de  los  residuales 

(la  respuesta  es  y) 
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APLICACIONES 

12.32  Contaminacion  del  aire  Consulte  el  ejercicio 
12.20,  en  el  que  se  registro  la  respuesta  al  ozono  de 
un  monitor  de  contaminacion  del  aire,  para  varias 
concentraciones  diferentes  de  ozono.  Use  graficas  re- 
siduales  MINITAB  para  comentar  sobre  la  validez  de  las 
suposiciones  de  regresion. 


Salida  impresa  MINITAB  para  el  ejercicio  12.32 


12.33  Profesor  Asimov,  otra  vez  Consulted 
ejercicio  12.8,  en  el  que  el  numero  x  de  libros  escritos  por 
Isaac  Asimov  esta  relacionado  con  el  numero  de  meses  y 


que  tardo  en  escribirlos.  A  continuacion,  una  grafica  de 
los  datos. 


500- 

450- 

|  400- 
S 

c 

a  350-  • 

I 

g, 

>>  300- 

250- 

200-1 _ 1 _ ! _ ! _ ! _ 

100  200  300  400  500 

x(Numero  de  libras) 


a.  (■.Se  puede  ver  un  modelo  que  no  sea  una  relacion 
lineal  en  la  grafica  original? 

b.  El  valor  de  r  para  estos  datos  es  .959.  i Que  dice  esto 
acerca  del  ajuste  de  la  recta  de  regresion? 

c.  Vea  las  siguientes  graficas  de  diagnostico  para  estos 
datos.  /.Se  ve  algun  patron  en  los  residuales?  (',Sugiere 
esto  que  la  relacion  entre  el  numero  de  meses  y  el 
numero  de  libros  escritos  es  algo  que  no  sea  lineal? 
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1 2.34  Laptops  y  aprendizaje,  otra  vez  Consulte 
los  datos  dados  en  el  ejercicio  12.25.  La  salida  impresa 
MINITAB  se  reproduce  aquf. 


Analisis  de  regresion:  y  versus  x 

The  regression  equation  is 
y  =  -26.8  +  1.26  x 

P 

0 . 086 
0 . 000 

=  74.3% 


F  P 

Regression  1  3254.0  3254.0  56.05  0.000 

Residual  Error  18  1044.9  58.1 

Total  19  4299.0 


Predictor 

Constant 


Coef 
-26 . 82 
1.2617 


SE  Coef  T 

14.76  -1.82 

0.1685  7.49 


S  =  7.61912 


R-Sq  =  75.7%  R-Sq(adj) 


Analysis  of  Variance 
Source  DF 


a.  ^Que  suposiciones  deben  hacerse  acerca  de  la 
distribucion  del  error  aleatorio,  el 

b.  ^Cual  es  la  mejor  estimation  de  cr2,  la  varianza  del 
error  aleatorio,  el 

c.  Use  las  graficas  de  diagnostico  para  estos  datos  para 
comentar  sobre  la  validez  de  las  suposiciones  de 
regresion. 


Grafica  normal  de  probabilidad  de  los  residuales 

(la  respuesta  es  y) 


Residuales  versus  los  valores  ajustados 
(la  respuesta  es  y) 


(^p)oATOS  12.35  Televisores  de  alta  definicion  Enel 
ejercicio  3.19,  Consumer  Reports  dio  los  precios 
para  los  10  mejores  televisores  de  pantalla  de  cristal 
liquido  y  alta  definicion  (HDTVs),  en  la  categorfa  de  30 
a  40  pulgadas:  ^el  precio  de  uno  de  estos  depende  del 
tamano  de  la  pantalla?  La  tabla  siguiente  muestra 
los  10  costos  otra  vez,  junto  con  el  tamano  de  la  pantalla 
en  pulgadas.7 


Marca 

Precio 

Tamano 

JVC  LT-40FH96 

$2900 

40 

Sony  Bravia  KDL-V32XBR1 

1800 

32 

Sony  Bravia  KDL-V40XBR1 

2600 

40 

Toshiba  37HLX95 

3000 

37 

Sharp  Aquos  LC-32DA5U 

1300 

32 

Sony  Bravia  KLV-S32A10 

1500 

32 

Panasonic  Viera  TC-32LX50 

1350 

32 

JVC  LT-37X776 

2000 

37 

LG  37LP1D 

2200 

37 

Samsung  LN-R328W 

1200 

32 

yEl  precio  de  un  HDTV  depende  del  tamano  de  la 
pantalla?  Imagine  que  suponemos  que  la  relacion  entre 
xyyes  lineal,  y  efectuamos  una  regresion  lineal,  que 
resulta  en  un  valor  de  r2  =  .787. 

a.  ^Que  dice  el  valor  de  r2  acerca  de  la  fuerza  de  la 
relacion  entre  precio  y  tamano  de  pantalla? 

b.  La  grafica  residual  para  estos  datos,  generada  por 
MINITAB,  se  muestra  a  continuacion.  ^Esta  grafica 
revela  algun  resultado  atipico  en  el  conjunto  de  datos? 
Si  es  asi,  <  cual  punto  es  el  resultado  atipico? 


Residuales  versus  valores  ajustados 

(la  respuesta  es  Precio) 

800  H - 

600- 

400- 

I  200  - 
06 

0 - - - 

•  • 

-200  - 

-400  -I  _ | _ | _ | _ | _ | _ 

1500  1750  2000  2250  2500  2750  3000 

Valor  ajustado 

c.  Grafique  los  valores  de  x  y  y  usando  una  grafica  de 
dispersion.  ^Esta  grafica  confirma  las  sospechas 
del  inciso  b)?  (:,Cual  HDTV  representa  el  resultado 
atipico?  /.Es  esta  una  medicion  defectuosa  que  debe 
eliminarse  del  conjunto  de  datos?  Explique. 
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ESTIMACION  Y  PREDICCION  USANDO 
LA  RECTA  AJUSTADA 

Ahora  que  usted  ha 


•  probado  y  ajustado  la  recta  de  regresion,  y  =  a  +  bx,  para  asegurarse  que  es  util 
para  prediccion  y 

•  empleado  las  herramientas  de  diagnostico  para  asegurarse  que  ninguna  de  las 
suposiciones  de  regresion  han  sido  violadas 


esta  listo  para  usar  la  recta  para  uno  de  sus  dos  propositos: 

•  Estimar  el  valor  promedio  de  y  para  un  valor  determinado  de  x 

•  Predecir  un  valor  particular  de  y  para  un  valor  determinado  de  x 


La  muestra  de  n  pares  de  observaciones  han  sido  seleccionados  de  una  poblacion  en  la 
que  el  valor  promedio  de  y  esta  relacionado  con  el  valor  de  la  variable  de  pronostico  x 

por  la  recta  de  medias, 

E(y)  =  a  +  fix 

una  recta  desconocida,  que  se  muestra  como  recta  interrumpida  en  la  bgura  12.12. 
Recuerde  que  para  un  valor  fijo  de  x,  por  ejemplo  x0,  los  valores  particulares  de  y  se  des- 
vfan  desde  la  recta  de  medias.  Estos  valores  de  y  se  supone  que  tienen  una  distribucion 
normal  con  media  igual  a  a  +  fix0  y  varianza  a2,  como  se  ve  en  la  bgura  12.12. 


FIGURA  12.12 

Distribucion  de  ypara 
x=  x0 


y 


/ 

/ 

/ 

Recta  de  medias 
E(y)  =  a  +  fk 


x 


Como  los  valores  calculados  de  a  y  b  varian  de  una  muestra  a  otra,  cada  nueva  mues¬ 
tra  produce  una  diferente  recta  de  regresion  y  =  a  +  bx,  que  se  puede  usar  ya  sea  para 
estimar  la  recta  de  medias  o  para  predecir  un  valor  particular  de  y.  La  bgura  12. 13  mues¬ 
tra  una  de  las  posibles  conbguraciones  de  la  recta  ajustada  (azul),  la  recta  de  medias 
desconocida  (gris),  y  un  valor  particular  de  y  (el  punto  azul). 
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FIGURA  12.13 

Error  al  estimar  £(y) 
y  predecir  y 


Error  de 
estimar 
E(y) 


lA  que  distancia  estara  nuestro  estimador  y  =  a  +  bx0  desde  la  cantidad  a  estimar  o 
predecir?  Esto  depende,  como  siempre,  de  la  variabilidad  de  nuestro  estimador,  medido 
por  su  error  estandar.  Se  puede  demostrar  que 

y  =  a  +  bx  o 

el  valor  estimado  de  y  cuando  x  =  x0,  es  un  estimador  insesgado  de  la  recta  de  medias, 
a  +  (3x0  y  que  y  esta  normalmente  distribuida  con  el  error  estandar  de  y  estimado  por 


SW)-jMSE(i+^2^f£) 

La  estimation  y  prueba  estan  basadas  en  la  estadistica 

y  -  m 

1  SE(y) 

que  tiene  una  distribucion  t  con  (n  —  2)  grados  de  libertad. 

Para  formar  un  intervalo  de  confianza  (1  —  a)  100%  para  el  valor  promedio  de  y 
cuando  x  =  x0,  medido  por  la  recta  de  medios,  a  +  fix,,,  se  puede  usar  la  forma  usual  para 
un  intervalo  de  confianza  basado  en  la  distribucion  t: 

y  ±  tal2SE(y) 

No  obstante,  si  se  escoge  predecir  un  valor  particular  de  y  cuando  x  =  x0,  hay  algun 
error  adicional  en  la  prediccion  debido  a  la  desviacion  de  y  desde  la  recta  de  medias.  Si 
examinamos  la  figura  12.13,  se  puede  ver  que  el  error  en  prediccion  tiene  dos  compo- 
nentes: 

•  El  error  al  usar  la  recta  ajustada  para  estimar  la  recta  de  medias 

•  El  error  causado  por  la  desviacion  de  y  desde  la  recta  de  medias,  medida  por  cr2 

La  varianza  de  la  diferencia  entre  y  y  y  es  la  suma  de  estas  dos  varianzas  y  forma  la  base 
para  el  error  estandar  de  (y  —  y)  empleado  para  prediccion: 


CONSEJO 

Para  un  valor  determinado  de 
x,  el  intervalo  de  prediccion 
es  siempre  mas  ancho  que  el 
intervalo  de  confianza. 


SE  (y  -  y) 


1 

r 

]mse 

IK- 
1  ^ 

o 

+ 

+ 

_ 1 

y  el  intervalo  de  prediccion  (1  —  a)  100%  se  forma  como 

y  ±  hv>SE(y  -  y) 
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E  J  E  M  P  L 


E  J  E  M  P  L 


INTERVALOS  DE  CONFIANZA  Y  PREDICCION 
(1  -  a)  100% 


Para  estimar  el  valor  promedio  de  y  cuando  x  =  x„: 


y  ±  ?a/2  MSE 


i  +  fa  Z 

n  +  v 


Para  predecir  un  valor  particular  de  y  cuando  x  =  x(t: 


y  ±  tan,  MSE 


fa  ~  xY 

«  $ 

'-'rr 


donde  es  el  valor  de  t  con  (n  —  2)  grados  de  libertad  y  area  all  a  su  derecha. 

Use  la  informacion  del  ejemplo  12.1  para  estimar  el  promedio  de  calificaciones  en 
calculo  para  estudiantes  cuya  puntuacion  de  aprovechamiento  es  50,  con  un  intervalo  de 
confianza  de  95%. 


La  estimacion  puntual  de  E(y\x0  =  50),  el  promedio  de  calificacion  en 
calculo  para  estudiantes  cuya  puntuacion  de  aprovechamiento  es  50,  es 

y  =  40.78424  +  .76556(50)  =  79.06 


El  error  estandar  de  y  es 


MSE 


i  +  faj: _±L 

n  +  s 

^XX 


=  J  75.7532 


!_  ,  (50  ~  46)2 
L 10  2474 


=  2.840 


y  el  intervalo  de  confianza  de  95%  es 
79.06  ±  2.306(2.840) 

79.06  ±  6.55 

Nuestros  resultados  indican  que  el  promedio  de  calificacion  en  calculo  para  estudiantes 
cuya  puntuacion  de  50  en  el  examen  de  aprovechamiento  estara  entre  72.51  y  85.61. 


Un  estudiante  tomo  el  examen  de  aprovechamiento  y  obtuvo  50  pero  todavfa  no  ha 
tornado  el  examen  de  calculo.  Usando  la  informacion  del  ejemplo  12.1,  prediga  la  califi¬ 
cacion  en  calculo  para  este  estudiante,  con  un  intervalo  de  prediccion  de  95%. 


Solucion  El  valor  predicho  de  y  es  y  =  79.06,  como  en  el  ejemplo  12.4.  No  obstante, 
el  error  en  prediccion  se  mide  con  SE(y  —  y),  y  el  intervalo  de  prediccion  de  95%  es 


79.06 


2.306 


75.7532 


1  .  (50  -  46)2 
10  2474 


79.06  ±  2.306(9.155) 


79.06  ±  21.11 


o  sea  de  57.95  a  100.17.  El  intervalo  de  prediccion  es  mas  ancho  que  el  intervalo  de 
confianza  del  ejemplo  12.4  por  la  variabilidad  extra  al  predecir  el  valor  real  de  la  res- 
puesta  y. 
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Es  frecuente  que  un  punto  particular  sobre  la  recta  de  medias  sea  de  interes  para  expe- 
rimentadores,  la  interseccion-y  a,  es  decir,  el  valor  promedio  de  y  cuando  x0  =  0. 

Antes  de  ajustar  una  recta  a  los  datos  de  la  calificacion  en  calculo  y  puntos  de  aprove- 
chamiento,  se  puede  pensar  que  una  puntuacion  de  0  en  el  examen  de  aprovechamiento 
puede  predecir  una  calificacion  de  0  en  el  examen  de  calculo.  Esto  implica  que  debemos 
ajustar  un  modelo  con  a  igual  a  0.  ,',Los  datos  apoyan  la  hipotesis  de  un  punto  de  cruce 
en  0? 


Solucion  Se  puede  contestar  esta  pregunta  al  construir  un  intervalo  de  confianza  de 
95%  para  el  punto  a  de  cruce  con  el  eje  y,  que  es  el  valor  promedio  de  y  cuando  x  =  0. 
La  estimacion  de  a  es 


y  =  40.784  +  .76556(0)  =  40.784  =  a 
y  el  intervalo  de  confianza  de  95%  es 


$  ±  4/2.  MSE 


I  +  <Ao  ~  xf 


79.06  ±  2.306  J 75.7532 
40.784  ±  19.617 


_L  +  (0  -  46)2 


LV 10  2474  J 


o  de  21.167  a  60.401,  un  intervalo  que  no  contiene  el  valor  a  =  0.  En  consecuencia,  es 
improbable  que  el  cruce  con  el  eje  y  sea  0.  Se  debe  incluir  un  punto  de  cruce  diferente  de 
cero  en  el  modelo  y  =  a  +  (3x  +  e. 


FIGURA  12.14 

Parte  de  la  salida  impresa 
MINITAB  para  el  ejemplo 
12. B 


FIGURA  12.15 

Opcion  MINITAB  para 
estimacion  y  prediccion 


Para  esta  situacion  especial  en  la  que  estamos  interesados  en  probar  o  estimar  el  punto 
de  cruce  a  con  el  eje  y  para  la  recta  de  medias,  las  inferencias  comprenden  la  estimacion 
muestral  a.  La  prueba  para  un  punto  de  cruce  en  0  se  da  en  la  figura  12.14  en  la  recta 
sombreada  marcada  como  “Constante”.  El  coeficiente  dado  como  40.784  es  a,  con  error 
estandar  dado  en  la  columna  marcada  “SE  Coef”  como  8.507,  que  concuerda  con  el 
valor  calculado  en  el  ejemplo  12.6.  El  valor  de  T  =  4.79  se  encuentra  al  dividir  a  entres 
su  error  estandar  con  valor  p  =  .001. 


Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

40 . 784 

8.507 

4 . 79 

0 . 001 

X 

0 . 7656 

0.1750 

4 .38 

0 . 002 

Se  puede  ver  que  es  bastante  lento  calcular  manualmente  estos  intervalos  de  predic¬ 
cion  y  estimacion,  ademas  de  que  es  diffcil  mantener  precision  en  los  calculos,  pero  por 
fortuna  hay  programas  de  computo  que  pueden  hacer  los  calculos.  El  comando  de  regre- 
sion  MINITAB  tiene  una  opcion  para  estimacion  o  prediccion  cuando  se  especifica  el  valor 
necesario  de  x.  La  salida  impresa  de  la  figura  12.15  da  los  valores  de  y  =  79.06  marcados 
“Fit”,  el  error  estandar  de  y,  SE(  y),  marcado  “SE  Fit”,  el  intervalo  de  confianza  para  el 
valor  promedio  de  y  cuando  x  =  50,  marcado  “95.0%  Cl”,  y  el  intervalo  de  prediccion 
para  y  cuando  x  =  50,  marcado  “95.0%  PI”. 


Predicted  Values  for  New  Observations 

New  Obs  Fit  SE  Fit  95%  Cl  95%  PI 

1  79.06  2.84  (72.51,  85.61)  (57.95,  100.17) 

Values  of  Predictors  for  New  Observations 
New  Obs  x 

1  50.0 
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Las  bandas  de  confianza  y  bandas  de  prediction  generadas  por  MINITAB  para  los  datos 
de  calificaciones  en  calculo  se  muestran  en  la  figura  12.16.  Observe  que  en  general  las 
bandas  de  confianza  son  mas  angostas  que  las  bandas  de  prediction  para  todo  valor  de 
puntos  x  de  examen  de  aprovechamiento.  Es  seguro  que  usted  esperarfa  predicciones 
de  que  un  valor  individual  fuera  mucho  mas  variable  que  las  estimaciones  del  valor 
pro  medio.  Tambien  observe  que  las  bandas  parecen  hacerse  mas  anchas  a  medida  que 
el  valor  de  x0  se  aleja  de  la  media  3c.  Esto  es  porque  los  errores  estandar  empleados  en 
los  intervalos  de  confianza  y  prediction  contienen  el  termino  (jc0  —  3c)2,  que  se  hace  mas 
grande  cuando  los  dos  valores  divergen.  En  la  practica,  esto  significa  que  estimation 
y  prediction  son  mas  precisos  cuando  x0  esta  cerca  del  centro  del  rango  de  los  valores 
de  x.  Se  pueden  localizar  los  intervalos  calculados  de  confianza  y  prediction  cuando 
x  =  50  en  la  figura  12.16. 


FIGURA  12.16 

Intervalos  de  confianza  y 
prediccion  para  los  datos 
de  la  tabla  12.1 


Grafica  de  recta  ajustada 

y  =  40.78  +  0.7656  x 


Regression 
95%  Cl 
95%  PI 


S  8.70363 

R-Sq  70.5% 

R-Sq(adj)  66.8% 


Puntos 


© 


E  JERCICIOS 


TECNICAS  BASICAS 

12.36  Consulte  el  ejercicio  12.6. 

a.  Estime  el  valor  promedio  de  y  cuando  x  =  1 ,  usando 
un  intervalo  de  confianza  de  90%. 

b.  Encuentre  un  intervalo  de  confianza  de  90%  para 
algun  valor  de  y  a  ser  observado  en  el  futuro  cuando 
x  =  1. 

12.37  Consulte  el  ejercicio  12.7.  Partes  de  la  salida 

impresa  MINITAB  se  muestran  a  continuation. 


a.  Encuentre  un  intervalo  de  confianza  para  el  valor 
promedio  de  y  cuando  x  =  2. 

b.  Encuentre  un  intervalo  de  prediccion  de  95%  para 
algun  valor  de  y  a  ser  observado  en  el  futuro  cuando 
x  =  2. 

c.  El  ultimo  renglon  de  la  tercera  section  de  la  salida 
impresa  indica  un  problema  con  uno  de  los  valores 
ajustados.  /.Que  valor  de  x  corresponde  al  valor 
ajustado  y  =  1.5429?  ,',Que  problema  ha  detectado  el 
programa  MINITAB ? 


Salida  impresa  MINITAB  para  el  ejercicio  12.37 


APLICACIONES 


Analisis  de  regresion:  y  versus  x 


The  regression  equation  is 
y  =  6.00  -  0.557  x 


Predictor  Coef  SE  Coef  T  P 
Constant  6.0000  0.1759  34.10  0.000 
x  -0.55714  0.04518  -12.33  0.000 


Predicted  Values  for  New  Observations 

New  Obs  Fit  SE  Fit  95.0%  Cl  95.0%  PI 

1  4.8857  0.1027  (4.6006,  5.1708)  (4.2886,  5.4829) 

2  1.5429  0.2174  (0.9392,  2.1466)  (0.7430,  2.3427)  X 

X  denotes  a  point  that  is  an  outlier  in  the  predictors. 


Values  of  Predictors  for  New  Observations 
New  Obs  x 


datos  12.38  iQue  comprar?  Serealizoun 
experimento  de  investigation  de  mercado, 
para  estudiar  la  relation  entre  el  tiempo  necesario  para 
que  un  comprador  llegue  a  una  decision  y  el  numero  de 
presentaciones  alternativas  de  un  producto.  Se  eliminaron 
nombres  de  marca  en  paquetes  para  reducir  los  efectos 
de  preferencias  de  marcas.  Los  compradores  hicieron 
su  selection  usando  las  descripciones  del  producto, 
hechas  por  los  fabricantes  en  los  paquetes,  como  unicas 
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gufas  para  comprar.  El  tiempo  necesario  para  tomar  una 
decision  se  registro  para  15  participantes  en  el  estudio  de 
investigation  de  mercado. 


Tiempo  para 
decision,  y(segundos) 

5,  8,  8,  7,  9 

7,  9,8,  9,10 

10, 11,  10, 12,9 

Numero  de 
alternativas,  x 

2 

3 

4 

a.  Encuentre  la  recta  de  mmimos  cuadrados  apropiada 
para  estos  datos. 

b.  Grafique  los  puntos  y  grafique  la  recta  como  prueba  en 
sus  calculos. 

c.  Calcule  s2. 

d.  <,Los  datos  dan  suficiente  evidencia  para  indicar  que  la 
duration  esta  linealmente  relacionada  con  el  numero 
de  disenos  alternativos  de  paquete?  (Pruebe  al  nivel  de 
significancia  de  a  =  .05.) 

e.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interprete  su  valor. 

f.  Si  estan  disponibles,  examine  las  graficas  de 
diagnostico  para  verificar  la  validez  de  las 
suposiciones  de  regresion. 

g.  Estime  el  promedio  de  tiempo  necesario  para  llegar 
a  una  decision  cuando  se  presenten  tres  alternativas, 
usando  un  intervalo  de  confianza  de  95%. 


Salida  impresa  MINITAB  para  el  Ejercicio  12.39 


Analisis  de  regresion:  y  versus  x 

The  regression  equation  is 
y  =  251206  +  27.4  x 

Predictor  Coef  SE  Coef  T  P 

Constant  251206  3389  74.13  0.000 

x  27.406  1.828  14.99  0.000 

S  =  1792.72  R-Sq  =  95.7%  R-Sq(adj)  =  95.3% 

Predicted  Values  for  New  Observations 

New  Obs  Fit  SE  Fit  95 . 0%  Cl  95 . 0%  PI 

1  299989  526  (298817,  301161)  (295826,  304151) 

2  306018  602  (304676,  307360)  (301804,  310232) 

Values  of  Predictors  for  New  Observations 
New  Obs  x 

1  1780 

2  2000 


a.  (',Se  puede  ver  algun  patron  que  no  sea  una  relacion 
lineal  en  la  grafica  original? 

b.  El  valor  de  r2  para  estos  datos  es  .957.  pQue  nos  dice 
esto  acerca  del  ajuste  de  la  recta  de  regresion? 

c.  Vea  las  siguientes  graficas  de  diagnostico  para  estos 
datos.  ^Se  ve  algun  patron  en  los  residuales?  ^Esto 
sugiere  que  la  relacion  entre  precio  y  pies  cuadrados 
es  algo  que  no  sea  lineal? 


Salida  impresa  MINITAB  para  el  ejercicio  12.39 


1 2.39  Precios  de  vivienda  Si  una  persona 

DATOS  1 

trata  de  rentar  un  departamento  o  comprar  una 

EX1239  ,  ,  ,  ^ 

casa,  encuentra  que  los  vendedores  fajan  rentas  y  precios 
de  casas  con  base  en  la  superficie  en  pies  cuadrados  de 
espacio  con  calefaccion.  Los  datos  de  la  tabla  siguiente 
dan  la  superficie  y  precios  de  venta  dsn  =  12  casas 
seleccionadas  al  azar  de  las  vendidas  en  una  ciudad  pequena. 
Use  la  salida  impresa  MINITAB  para  contestar  las  preguntas. 


Pies  cuadrados,  x 

Precio,  y 

Pies  cuadrados,  x 

Precio,  y 

1460 

$288700 

1977 

$305400 

2108 

309300 

1610 

297000 

1743 

301  400 

1530 

292400 

1499 

291  100 

1759 

298200 

1864 

302400 

1821 

304300 

2391 

314900 

2216 

311700 

Grafica  de  datos  para  el  ejercicio  12.39 


315  000-  * 

310000-  t 

„  305  000- 

o  • 

i 

^  300000- 
295  000- 

290000- 

1500  1600  1700  1800  1900  2000  2100  2200  2300  2400 

x  (Pies  cuadrados) 


Residuales  contra  valores  ajustados 

(la  respuesta  es  y) 


Valor  ajustado 
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12.40  Precios  de  vivienda  li  Consulte  el  ejercicio 
12.39  y  el  conjunto  de  datos  EX1239. 

a.  Estime  el  promedio  de  incremento  en  el  precio  para 
un  aumento  de  1  pie  cuadrado  para  casas  vendidas 
en  la  ciudad.  Use  un  intervalo  de  confianza  de  99%. 
Interprete  su  estimacion. 

b.  Un  vendedor  de  bienes  rafces  necesita  estimar  el 
promedio  de  precio  de  venta  de  casas  con  un  total 
de  2000  pies  cuadrados  de  espacio  con  calefaccion. 
Use  un  intervalo  de  confianza  de  95%  e  interprete  su 
estimacion. 

c.  Calcule  el  precio  por  pie  cuadrado  para  cada  casa 
y  luego  calcule  la  media  muestral.  (iPor  que  esta 
estimacion  del  promedio  de  costo  por  pie  cuadrado  no 
es  igual  a  la  respuesta  del  inciso  a)?  ^Debe  ser  igual? 
Explique. 

d.  Suponga  que  una  casa  con  1780  pies  cuadrados 
de  espacio  con  calefaccion  se  ofrece  a  la  venta. 
Construya  un  intervalo  de  prediccion  de  95%  para  el 
precio  al  cual  se  vendera  la  casa. 

12.41  :resas  111  Los  datos  siguientes  (ejercicios 
12.16  y  12.24)  se  obtuvieron  en  un  experimento  que 
relacionaba  la  variable  dependiente,  y  (textura  de  fresas), 
con  x  (temperatura  de  almacenamiento  codificada). 


X 

-2  -2 

0 

2 

2 

y 

4.0  3.5 

2.0 

0.5 

0.0 

a.  Estime  la  textura  esperada  de  fresas  para  una 
temperatura  de  almacenamiento  codificada  de 
x  =  —  1 .  Use  un  intervalo  de  confianza  de  99%. 

b.  Prediga  el  valor  particular  de  y  cuando  x  =  1  con  un 
intervalo  de  prediccion  de  99%. 

c.  i  A  que  valor  de  x  permanecera  mi'nimo  el  ancho  del 
intervalo  de  prediccion  para  un  valor  particular  de  y, 
suponiendo  que  n  permanece  fija? 

(^) datos  12.42  Tom  Brady  El  numero  de  pases 

completos  y  el  numero  total  de  yardas  pasadas 
para  Tom  Brady,  mariscal  de  campo  de  los  Patriotas 


de  Nueva  Inglaterra,  se  registraron  en  los  16  juegos 
regulares  de  la  temporada  de  futbol  de  2006. 8  En  la 
semana  6  no  se  jugo  y  no  hay  datos  reportados. 


Semana 

Completos 

Total  yardas 

1 

11 

163 

2 

15 

220 

3 

31 

320 

4 

15 

188 

5 

16 

140 

6 

* 

* 

7 

18 

195 

8 

29 

372 

9 

20 

201 

10 

24 

253 

11 

20 

244 

12 

22 

267 

13 

27 

305 

14 

12 

78 

15 

16 

109 

16 

28 

249 

a.  (,CuaI  es  la  recta  de  rmnimos  cuadrados  que  relaciona 
el  total  de  yardas  pasadas  con  el  numero  de  pases 
completos  para  Tom  Brady? 

b.  (',Quc  proportion  de  la  variation  total  esta  explicada 
por  la  regresion  de  total  de  yardas  pasadas  (v)  en  el 
numero  de  pases  completos  (x)1 

c.  Si  las  hay,  examine  las  graficas  de  dispersion  para 
comprobar  la  validez  de  las  suposiciones  de  regresion. 

12.43  Tom  Brady,  continua  Consulte  el  ejercicio 

12.42. 

a.  Estime  el  numero  promedio  de  yardas  pasadas  para 
juegos  en  los  que  Brady  lanza  20  pases  completos, 
usando  un  intervalo  de  confianza  de  95%. 

b.  Prediga  el  numero  real  de  yardas  pasadas  para  juegos 
en  los  que  Brady  lanza  20  pases  completos  usando  un 
intervalo  de  confianza  de  95%. 

c.  7,  Serfa  aconsejable  usar  la  recta  de  mmimos  cuadrados 
del  ejercicio  12.42  para  predecir  el  numero  total  de 
yardas  pasadas  de  Brady,  para  un  juego  en  el  que 
lanzo  solo  5  pases  completos?  Explique. 


anAlisis  de  correlacion 


En  el  capitulo  3  introdujimos  el  coeficiente  de  correlacion  como  medida  de  la  fuerza  de 
la  relation  lineal  entre  dos  variables.  El  coeficiente  de  correlacion,  r,  formalmente  deno- 
minado  coeficiente  de  correlacion  muestral  de  momento  de  producto  de  Pearson,  se 
define  a  continuation. 
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COEFICIENTE  DE  CORRELACION  DE  MOMENTO 
DE  PRODUCTO  DE  PEARSON 


resta  siempre  entre 
-1  y  +1. 


Las  varianzas  y  covarianza  se  pueden  hallar  por  calculo  directo,  con  el  uso  de  una  calcu- 
ladora  con  capacidad  de  estadfstica  de  dos  variables,  o  usando  un  paquete  de  estadfstica 
como  el  MINITAB.  Las  varianzas  y  covarianza  se  calculan  como 

_  sxy  2  _  Sxx  2  _  syy 

~  n  -  1  x~  n-  1  y~  n-  1 


y  use  Sxy,  Sxx  y  Syy,  las  mismas  cantidades  empleadas  en  analisis  de  regresion  en  este 
capitulo.  En  general,  cuando  una  muestra  de  n  individuos  o  unidades  experimentales  se 
selecciona  y  dos  variables  se  miden  en  cada  individuo  o  unidad,  de  modo  que  ambas 
variables  sean  aleatorias,  el  coeficiente  de  correlation  r  es  la  medida  apropiada  de 
linealidad  para  usar  en  esta  situation. 

Las  estaturas  y  pesos  de  n  =  10  jugadores  atacantes  de  futbol  se  seleccionan  al  azar  de 
un  equipo  de  estrellas  de  un  condado.  Calcule  el  coeficiente  de  correlation  para  las  esta¬ 
turas  (en  pulgadas)  y  pesos  (en  libras)  dado  en  la  tabla  12.4. 


tabla  12.4  Estaturas  y  pesos  de  n  =  10  estrellas  profundos 


Jugador 

Estatura, x 

Peso,  y 

1 

73 

185 

2 

71 

175 

3 

75 

200 

4 

72 

210 

5 

72 

190 

6 

75 

195 

7 

67 

150 

8 

69 

170 

9 

71 

180 

10 

69 

175 

Solucion  Debe  usarse  el  metodo  apropiado  de  entrada  de  datos  de  su  calculadora 
cientffica  para  verificar  los  calculos  para  las  sumas  de  cuadrados  y  productos  cruz, 

=  328  Sxx  =  60.4  S^  =  2610 

usando  las  formulas  de  calculo  dadas  antes  en  este  capitulo.  Entonces 

=  .8261 

o  sea  r  =  .83.  Este  valor  de  r  es  mas  bien  cercano  a  1,  el  maximo  valor  posible  de  r.  que 
indica  una  relation  lineal  positiva  bastante  fuerte  entre  estatura  y  peso. 


_ 328 _ 

V(60.4)(2610) 


El  signo  de  res  siempre 
igual  que  el  signo  de  la 
pendiente  b. 


Hay  una  relation  directa  entre  las  formulas  de  calculo  para  el  coeficiente  de  correla¬ 
tion  r  y  la  pendiente  de  la  recta  de  regresion  b.  Como  el  numerador  de  ambas  cantidades 
es  Sxy,  tanto  r  como  b  tienen  el  mismo  signo.  Por  tanto,  el  coeficiente  de  correlation  tie- 
ne  estas  propiedades  generales: 

•  Cuando  r  =  0,  la  pendiente  es  b  =  0  y  no  hay  relation  lineal  entre  xy  y. 

•  Cuando  r  es  positiva,  b  tambien  es  positiva  y  hay  una  relation  lineal  positiva 
entre  xy  y. 
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•  Cuando  r  es  negativa,  b  tambien  es  negativa  y  hay  una  relacion  lineal  negativa 
entre  x  y  y. 

En  la  section  12.5  demostramos  que 

2  SSR  SS  Total  -  SSE 
SS  Total  SS  Total 

En  esta  forma,  se  puede  ver  que  r  nunca  puede  ser  mayor  a  1 ,  de  modo  que  —  1  <  r  <  1 . 

Ademas,  se  puede  ver  la  relacion  entre  la  variation  aleatoria  (medida  por  SSE)  y  r. 

•  Si  no  hay  variacion  aleatoria  y  todos  los  puntos  caen  en  la  recta  de  regresion, 
entonces  SSE  =  0  y  r~  =  1. 

•  Si  los  puntos  estan  dispersos  en  forma  aleatoria  y  no  hay  variacion  explicada  por 
regresion,  entonces  SSR  =  0  y  r  =  0. 


La  figura  12.18  muestra  cuatro  graficas  de  dispersion  tipicas  y  sus  coeficientes  de 
correlacion  asociados.  Observe  que  en  la  grafica  de  dispersion  (d)  parece  haber  una  rela¬ 
tion  curvilmea  entre  x  y  y,  pero  r  es  aproximadamente  0,  lo  cual  refuerza  el  hecho  de  que 
r  es  una  medida  de  una  relacion  lineal  (no  curvilmea)  entre  dos  variables. 
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FIGURA  12.18 

Algunas  graficas  de 
dispersion  tipicas  con 
valores  aproximados  de  r 


y 


y 


a) 


X 


b) 


X 


Fuerte  correlation  lineal 
positiva;  r  es  cercana  a  1 


.  #  • 


c) 


Fuerte  correlation  lineal 
negativa;  r  es  cercana  a  -1 


d) 


x 


No  hay  correlation  lineal 
aparente;  r  es  cercana  a  0 


Correlation  curvilmea,  pero  no 
lineal;  r  es  cercana  a  0 


Considere  una  poblacion  generada  al  medir  dos  variables  aleatorias  en  cada  unidad 
experimental.  En  esta  poblacion  bivariada,  el  coeficiente  de  correlacion  poblacional 
p  se  calcula  e  interpreta  como  esta  en  la  muestra.  En  esta  situacion,  el  experimentador 
puede  probar  la  hipotesis  de  que  no  hay  correlacion  entre  las  variables  x  y  y  usando  una 
estadistica  de  prueba  que  sea  exactamente  equivalente  a  la  prueba  de  la  pendiente  /3  de 
la  seccion  12.5.  El  procedimiento  de  prueba  se  muestra  a  continuacion. 


Se  puede  demostrar  que 


b- 0 

Vmse  IS„ 


PRUEBA  DE  HIPOTESIS  RESPECTO  AL  COEFICIENTE 
DE  CORRELACION  p 


1 .  Hipotesis  nula:  H0:  p  =  0 

2.  Hipotesis  alternativa: 


Prueba  de  una  cola  Prueba  de  dos  colas 


Ha:  p>  0  H3l:  p¥=  0 

(o  p  <  0)  _ 


3. 


Estadistica  de  prueba:  t  =  r 


n  —  2 

1  2 

1  —  r 


Cuando  se  satisfacen  las  suposiciones  dadas  en  la  seccion  12.2,  la  estadistica  de 
prueba  tendra  una  distribucion  t  de  Student  con  (n  —  2)  grados  de  libertad. 


4.  Region  de  rechazo:  rechazar  H0  cuando 

Prueba  de  una  cola  Prueba  de  dos  colas 

t>ta  t>tal 2  O  t  <  -ta/2 

(o  t  <  —ta  cuando  la  hipotesis 
alternativa  sea  Ha :  p  <  0) 

o  cuando  valor  p  <  a 
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Los  valores  de  ta  y  t„n  se  pueden  hallar  usando  la  tabla  4  del  apendice  I  o  el  applet 
^-Probabilities.  Use  los  valores  de  t  correspondientes  a  (n  —  2)  grados  de  libertad. 


Consulte  los  datos  de  estatura  y  peso  del  ejemplo  12.7.  La  correlacion  entre  estatura 
y  peso  se  calculo  como  r  =  .8261.  (,Esta  correlacion  es  significativamente  diferente 
de  0? 


CONSEJO 


El  valor  fy  valor  p  para  probar 
H0 :  p  =  0  sera  identico  al 
valor  fy  valor  p  para  probar 
Ha:p  =  0. 


Solucion  Para  probar  las  hipotesis 
H0:  p  =  0  versus  Ha:  p  ¥=  0 
el  valor  del  estadfstico  de  prueba  es 


=  .8261 


10  -2 


1(1  -  (.8261)- 


4.15 


que  para  n  =  10  tiene  una  distribucion  t  con  8  grados  de  libertad.  Como  este  valor  es 
mayor  que  t0 05  =  3.355,  el  valor  p  de  dos  colas  es  menor  a  2(.005)  =  .01  y  la  correlacion 
se  declara  significativa  al  nivel  de  1%  ( P  <  .01).  El  valor  r2  =  .82612  =  .6824  significa 
que  alrededor  de  68%  de  la  variation  en  una  de  las  variables  es  explicada  por  la  otra.  La 
salida  impresa  MINITAB  de  la  figura  12.19  muestra  la  correlacion  r  y  el  valor  p  exacto 
para  probar  su  significance. 


FIGURA  12.19 

Salida  impresa  MINITAB 
para  el  ejemplo  12.8 


Correlaciones:  x,  y 

Pearson  correlation  of  x  and  y  =  0.826 
P-Value  =  0.003 


Si  los  coeficientes  lineales  de  correlacion  entre  y  y  cada  una  de  las  dos  variables  x,  y 
x2  se  calcular  como  .4  y  .5,  respectivamente,  no  se  concluye  que  un  medio  de  prediccion 
que  use  ambas  variables  sea  [(.4)2  +  (.5)2]  =  .41,  o  sea  una  reduction  de  41%  en  la  suma 
de  cuadrados  de  desviaciones.  En  realidad,  x  y  x2  podrfan  estar  bastante  correlacionados 
y  por  tanto  contribuir  practicamente  con  la  misma  informacion  para  la  prediccion  de  y. 

Por  ultimo,  recuerde  que  r  es  una  medida  de  correlacion  lineal  y  que  x  y  y  podrfan 
estar  perfectamente  relacionadas  por  alguna  funcion  curvilinea  cuando  el  valor  obser- 
vado  de  r  sea  igual  a  0.  El  problema  de  estimar  o  predecir  y  usando  informacion  dada 
por  varias  variables  independientes,  xu  x2,  ...,  xk,  es  el  tema  del  capitulo  13. 


© 


E  JERCICIOS 


TECNICAS  BASICAS 


b.  La  recta  tiene  pendiente  negativa. 


12.44  (U11  que  forma  el  coeficiente  de  correlacion  mide 
la  fuerza  de  la  relacion  lineal  entre  dos  variables  y  y  x? 

12.45  Describa  la  significancia  del  signo  algebraico  y  la 
magnitud  de  r. 

12.46  <j,Que  valor  toma  r  si  todos  los  puntos  caen  en  la 
misma  recta  en  estos  casos? 

a.  La  recta  tiene  pendiente  positiva. 


12.47  Nos  dan  estos  datos: 


X 

-2-1012 

y 

2  2  3  4  4 

a.  Grafique  los  puntos.  Con  base  en  su  grafica,  (:cual  sera 
el  signo  del  coeficiente  de  correlacion  muestral? 

b.  Calcule  r  y  r2  c  interprete  sus  valores. 
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12.48  Nos  dan  estos  datos: 


X 

1  2  3 

4  5  6 

V 

7  5  5 

3  2  0 

a.  Grafique  los  seis  puntos  en  papel  para  graficar. 

b.  Calcule  el  coeficiente  muestral  de  correlacion  r  e 
interprete. 

c.  i Oil  que  porcentaje  se  redujo  la  suma  de  cuadrados 
de  desviaciones  al  usar  el  pronosticador  de 
mfnimos  cuadrados  y  =  a  +  bx,  en  lugar  de  y  como 
pronosticador  de  y? 

12.49  Invierta  la  pendiente  de  la  recta  del  ejercicio 

12.48  al  reordenar  las  observaciones  y,  como  sigue: 


X 

1  2 

3  4  5  6 

y 

0  2 

3  5  5  7 

Repita  los  pasos  del  ejercicio  12.48.  Observe  el  cambio 
en  el  signo  de  r  y  la  relacion  entre  los  valores  de  r2  del 
ejercicio  12.48  y  este  ejercicio. 

APLICACIONES 

datos  12.50  Langostas  La  tabla  siguiente  da  los 
numeros  de  lapas  Octolasmis  tridens  y  O.  lowei 
en  cada  una  de  10  langostas.9  ^Le  parece  que  las  lapas 
compiten  por  espacio  en  la  superficie  de  una  langosta? 


Numero  de  campo 

de  langosta  0.  tridens  0.  lowei 


A0B1  645  6 

A062  320  23 

AO  66  401  40 

A070  364  9 

A0  67  327  24 

A0 69  73  5 

A0 64  20  86 

A0 68  221  0 

A065  3  109 

A063  5  350 


a.  Si  compiten,  /.se  espera  que  el  numero  x  de 
lapas  O.  tridens  y  el  numero  y  de  O.  lowei  esten 
correlacionados  positiva  o  negativamente?  Explique. 

b.  Si  desea  probar  la  teorfa  de  que  dos  tipos  de  lapas 
compiten  por  espacio  al  realizar  una  prueba  de 

la  hipotesis  nula  “el  coeficiente  de  correlacion 
poblacional  p  es  igual  a  0”,  <:,cual  es  su  hipotesis 
alternativa? 

c.  Realice  la  prueba  del  inciso  b)  y  exprese  sus 
conclusiones. 

datos  12.51  Capacitacion  de  habilidades 

sociales  Se  puso  en  practica  un  programa  de 
capacitacion  de  habilidades  sociales  con  siete  estudiantes, 


a  un  grado  de  dificultad  mediano,  en  un  estudio  para 
determinar  si  el  programa  causo  mejora  en  medidas  antes 
y  despues  del  estudio  y  en  calificaciones  de  conducta. 
Para  uno  de  estos  examenes,  los  puntos  de  antes  y 
despues  del  examen  para  los  siete  estudiantes  se  dan  en 
la  tabla  siguiente.10 


Persona 

Antes 

Despues 

Earl 

101 

113 

Ned 

89 

89 

Jasper 

112 

121 

Charlie 

105 

99 

Tom 

90 

104 

Susie 

91 

94 

Lori 

89 

99 

a.  /.Que  tipo  de  correlacion,  si  la  hay,  espera  usted  ver 
entre  puntos  antes  y  despues  del  examen?  Grafique  los 
datos.  0 La  correlacion  parece  ser  positiva  o  negativa? 

b.  Calcule  el  coeficiente  de  correlacion,  r.  /Hay  una 
correlacion  positiva  significativa? 

12.52  Hockey  G.  W.  Marino  investigo  las  variables 
relacionadas  con  la  capacidad  de  un  jugador  de  hockey 
para  hacer  un  rapido  arranque  desde  una  posicion  de 
reposo.11  En  el  experimento,  cada  patinador  arranco 
desde  una  posicion  de  reposo  y  trato  de  moverse  tan 
rapidamente  como  le  fuera  posible  en  una  distancia  de 

6  metros.  El  coeficiente  de  correlacion  r  entre  la  rapidez 
de  zancada  de  un  patinador  (numero  de  zancadas  por 
segundo)  y  el  tiempo  para  recorrer  la  distancia  de  6 
metros  para  la  muestra  de  69  patinadores,  fue  —.37. 

a.  /Los  datos  dan  suficiente  evidencia  para  indicar  una 
correlacion  entre  rapidez  de  zancadas  y  tiempo  para 
recorrer  la  distancia?  Pruebe  usando  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba. 

c.  /Cuales  son  las  implicaciones  practicas  de  la  prueba 
en  el  inciso  a)? 

12.53  Hockey  II  Consulte  el  ejercicio  12.52.  Marino 
calculo  que  el  coeficiente  de  correlacion  muestral  r, 
para  la  rapidez  de  zancadas  y  el  promedio  de  rapidez 

de  aceleracion  para  los  69  patinadores,  era  de  .36. 

/Los  datos  dan  suficiente  evidencia  para  indicar  una 
correlacion  entre  rapidez  de  zancadas  y  promedio  de 
aceleracion  para  los  patinadores?  Use  el  metodo  del 
valor  p. 

datos  12.54  Energfa  geotermica  Laenergfa 

geotermica  es  una  importante  fuente  de  energfa. 
Como  la  cantidad  de  energfa  contenida  en  1  libra  de  agua 
es  funcion  de  su  temperatura,  uno  podrfa  preguntarse 
si  el  agua  obtenida  de  pozos  mas  profundos  contiene 
mas  energfa  por  libra.  Los  datos  de  la  tabla  siguiente  se 
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reproducen  de  un  artfculo  sobre  sistemas  geotermicos 
escrito  por  A.  J.  Ellis.12 


Ubicacion  de  pozo 

Profundidad 
promedio  (max) 
de  perforacion 

Temperati 

promedio 

El  Tateo,  Chile 

650 

230 

Ahuachapan,  El  Salvador 

1000 

230 

Namafjall,  Islandia 

1000 

250 

Larderello  (region),  Italia 

600 

200 

Matsukawa,  Japon 

1000 

220 

Cerro  Prieto,  Mexico 

800 

300 

Wairakei,  Nueva  Zelanda 

800 

230 

Kizildere,  Turqula 

700 

190 

The  Geysers,  Estados  Unidos 

1500 

250 

7,  Hay  una  correlacion  positiva  significativa  entre 
la  profundidad  promedio  (max)  de  perforacion 
y  la  temperatura  promedio  (max)? 

12.55  Queso,  por  favor  La  demanda  de  alimentos 
saludables,  bajos  en  grasas  y  calorfas,  ha  resultado  en 
un  gran  numero  de  productos  “bajo  en  grasas”  o  “sin 
grasa”.  La  tabla  siguiente  muestra  el  numero  de  calorfas 
y  la  cantidad  de  sodio  (en  miligramos)  por  rebanada  para 
cinco  marcas  de  queso  americano  sin  grasa. 


Marca 

Sodio  (mg) 

Calorias 

Kraft  Fat  Free  Singles 

300 

30 

Ralphs  Fat  Free  Singles 

300 

30 

Borden®  Fat  Free 

320 

30 

Healthy  Choice®  Fat  Free 

290 

30 

Smart  Beat®  American 

180 

25 

a.  yDeben  usarse  metodos  de  analisis  de  regresion  lineal 
o  analisis  de  correlacion  para  analizar  los  datos? 
Explique. 

b.  Analice  los  datos  para  determinar  la  naturaleza  de  la 
relacion  entre  sodio  y  calorfas  en  queso  americano  sin 
grasa.  Use  cualesquiera  pruebas  estadfsticas  que  sean 
mas  apropiadas. 

datos  12.56  Temperatura  corporal  y  frecuencia 

cardiaca  (',Hay  alguna  relacion  entre  estas 
dos  variables?  Para  averiguarlo,  al  azar  seleccionamos 
12  personas  de  un  conjunto  de  datos  construido  por 
Allen  Shoemaker  ( Journal  of  Statistics  Education )  y 
registramos  sus  temperaturas  corporales  y  frecuencias 
cardiacas.13 


Persona 

1 

2 

3 

4 

5 

6 

Temperatura 

(grados) 

96.3 

97.4 

98.9 

99.0 

99.0 

96.8 

Frecuencia  cardiaca 
(pulsaciones  por  minuto) 

70 

68 

80 

75 

79 

75 

Persona 

7 

8 

9 

10 

11 

12 

Temperatura 

(grados) 

98.4 

98.4 

98.8 

98.8 

99.2 

99.3 

Frecuencia  cardiaca 
(pulsaciones  por  minuto) 

74 

84 

73 

84 

66 

68 

a.  Encuentre  el  coeficiente  de  correlacion  r,  que 
relacione  temperatura  corporal  y  frecuencia  cardiaca. 

b.  ('.Hay  suficiente  evidencia  para  indicar  que  hay 
correlacion  entre  estas  dos  variables?  Pruebe  al  nivel 
de  significancia  de  5%. 

(^) datos  12.57  Estadfsticas  en  beisbol  ,-,CI 

promedio  de  bateo  de  un  equipo  depende  en 
alguna  forma  del  numero  de  cuadrangulares  conectados 
por  el  equipo?  Los  datos  de  la  tabla  siguiente  muestran 
el  numero  de  cuadrangulares  del  equipo  y  el  promedio 
general  de  bateo  del  equipo  para  ocho  equipos  de  ligas 
may  ores  seleccionados  para  la  temporada  de  2006. 14 

Equipo  Total  cuadrangulares  Promedio  de  bateo  del  equipo 


Atlanta  Braves 

222 

.270 

Baltimore  Orioles 

164 

.227 

Boston  Red  Sox 

192 

.269 

Chicago  White  Sox 

236 

.280 

Houston  Astros 

174 

.255 

Philadelphia  Phillies 

216 

.267 

New  York  Giants 

163 

.259 

Seattle  Mariners 

Fuente:  ESPN.com 

172 

.272 

a.  Grafique  los  puntos  usando  una  grafica  de  dispersion. 
(■.Lc  parece  que  hay  alguna  relacion  entre  el  total  de 
cuadrangulares  y  el  promedio  de  bateo  del  equipo? 

b.  (-.Hay  alguna  correlacion  positiva  significativa  entre 
el  total  de  cuadrangulares  y  el  promedio  de  bateo  del 
equipo?  Pruebe  al  nivel  de  significancia  de  5%. 

c.  (',Piensa  usted  que  la  relacion  entre  estas  dos  variables 
serfa  diferente  si  hubieramos  visto  todo  el  conjunto  de 
franquicias  de  las  ligas  mayores? 
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REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  Un  modelo  probabilista  lineal 

1 .  Cuando  los  datos  exhiben  una  relation  lineal,  el 
modelo  apropiado  es  y  =  a  4-  /3x  +  e. 

2.  El  error  aleatorio  e  tiene  una  distribution  normal 
con  media  de  0  y  varianza  a2. 

II.  Metodo  de  minimos  cuadrados 

1 .  Las  estimaciones  ay  b,  para  a  y  b,  se  escogen 
para  reducir  SSE  al  minimo,  la  suma  del  cuadrado 
de  desviaciones  alrededor  de  la  recta  de  regresion, 
y  =  a  +  bx. 

2.  Las  estimaciones  de  minimos  cuadrados  son  b  = 
SJSXX  y  a  =  y  -  bx. 

III.  Analisis  de  varianza 

1.  SS  Total  =  SSR  +  SSE,  donde  SS  Total  =  Syy 
y  SSR  =  (Sxy)2/Sxx. 

2.  La  mejor  estimation  de  cr2  es  MSE  = 

SSE/(n  -  2). 

IV.  Prueba,  estimacion  y  prediccion 

1 .  Una  prueba  para  la  significancia  de  la  regresion 
lineal,  H0  :  (3  =  0,  se  puede  implementar  usando 
una  de  dos  estadisticas  de  prueba: 

t=  I  b  n  r  MSR 
V  MSE/.S\,  MSE 

2.  La  fuerza  de  la  relacion  entre  x  y  y  se  puede  medir 
usando 

_  SSR 
SS  Total 

que  se  acerca  a  1  cuando  la  relacion  se  hace  mas 
fuerte. 


3.  Use  graficas  de  residuales  para  comprobar  la 
no  normalidad,  desigualdad  de  varianzas,  o  un 
modelo  incorrectamente  ajustado. 

4.  Los  intervalos  de  confianza  se  pueden  construir 
para  estimar  el  punto  de  intersection  a  y  la  pen- 
diente  /3  de  la  recta  de  regresion,  asi  como  estimar 
el  valor  promedio  de  y,  E(y),  para  un  valor  deter- 
minado  de  x. 

5.  Se  pueden  construir  intervalos  de  prediction 
para  predecir  una  observation  particular,  y,  para 
un  valor  determinado  de  x.  Para  una  x  dada,  los 
intervalos  de  prediction  siempre  son  mas  anchos 
que  los  intervalos  de  confianza. 

V.  Analisis  de  correlacion 

1.  Use  el  coeficiente  de  correlacion  para  medir  la 
relacion  entre xyy  cuando  ambas  variables  son 
aleatorias: 


2.  El  signo  de  r  indica  la  direction  de  la  relacion; 

r  cerca  de  0  indica  que  no  hay  relacion  lineal,  y  r 
cerca  de  1  o  —  1  indica  una  fuerte  relacion  lineal. 

3.  Una  prueba  de  la  significancia  del  coeficiente  de 
correlacion  usa  la  estadistica 


y  es  identica  a  la  prueba  de  la  pendiente  (3. 


Procedimientos  de  regresion  lineal 


En  el  capitulo  3  usamos  algunos  de  los  procedimientos  de  regresion  lineal  disponibles 
en  MINITAB,  para  obtener  una  grafica  de  la  recta  de  regresion  de  minimos  cuadrados  de 
mejor  ajuste,  asi  como  para  calcular  el  coeficiente  de  correlacion  r  para  un  conjunto 
de  datos  bivariados.  Ahora  que  ya  hemos  estudiado  las  tecnicas  de  prueba  y  estimacion 
para  un  analisis  de  regresion  lineal  sencillo,  existen  mas  opciones  MINITAB  para  usted. 
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Considere  la  relation  entre  x  =  puntuacion  en  examen  de  aprovechamiento  en  mate- 
maticas  y  y  =  calificacion  final  en  calculo,  que  se  uso  como  ejemplo  en  todo  este  capf- 
tulo.  Introduzca  los  datos  en  las  primeras  dos  columnas  de  una  hoja  de  trabajo  MINITAB. 
Si  usa  Graph  —>  Scatterplot  — >  Simple,  puede  generar  la  grafica  de  dispersion  para 
los  datos,  como  se  ve  en  la  figura  12.2.  Pero,  las  principales  herramientas  inferenciales 
para  analisis  de  regresion  lineal  se  generan  usando  Stat  —*  Regression  —>  Regression. 
(Usted  usara  esta  misma  secuencia  de  comandos  en  el  capitulo  13,  cuando  estudie  anali- 
sis  de  regresion  multiple. )  El  cuadro  de  dialogo  para  el  comando  Regression  se  muestra 
en  la  figura  12.20. 

Seleccione  y  para  la  variable  “Response”  y  x  para  la  variable  “Predictor”.  Puede 
ahora  escoger  generar  algunas  graficas  de  residuales  para  comprobar  la  validez  de  sus 
suposiciones  de  regresion  antes  que  utilice  el  modelo  para  estimation  o  prediccion. 
Escoja  Graphs  para  exhibir  la  caja  de  dialogo  de  la  figura  12.21. 


FIGURA  1  2.20 


FIGURA  12.21 
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Hemos  usado  graficas  residuales  Regular,  poniendo  marca  en  las  cajas  para  “Normal 
plot  of  residuals”  y  “Residuals  versus  fits”.  De  un  clic  en  OK  para  regresar  a  la  caja  de 
dialogo  principal.  Si  ahora  escoge  Options,  puede  obtener  intervalos  de  confianza  y 
prediction  para  cualquiera  de  estos  casos: 

•  Un  solo  valor  de  x  (tecleado  en  la  caja  marcada  “Prediction  intervals  for  new 
observations”) 

•  Varios  valores  de  x  guardados  en  una  columna  (C3,  por  ejemplo)  de  la  hoja  de 
trabajo 

Introduzca  el  valor  x  =  50  en  la  figura  12.22  para  compararse  a  la  salida  dada  en  la  fi- 
gura  12.15.  Cuando  de  un  clic  en  OK  dos  veces,  la  salida  de  regresion  se  genera  como 
se  ve  en  la  figura  12.23.  Las  dos  herramientas  de  diagnostico  apareceran  en  ventanas  de 
graficas  separadas. 


FIGURA  1  2.23 
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Si  desea,  puede  ahora  graficar  los  puntos,  la  recta  de  regresion  y  los  lfmites  superiores 
e  inferiores  de  confianza  y  prediccion  (vease  la  figura  12. 16)  usando  Stat  —>  Regression 
—*  Fitted  Line  Plot.  Seleccione  y  y  x  para  las  variables  de  respuesta  y  prediccion  y  de 
un  clic  en  “Display  confidence  interval”  y  “Display  prediction  interval”  en  el  cuadro 
de  dialogo  Options.  Asegurese  que  Linear  este  seleccionado  como  el  “Type  of  Regres¬ 
sion  Model”,  de  modo  que  se  obtenga  un  ajuste  lineal  a  los  datos. 

Recuerde  que  en  el  capftulo  3  usamos  el  comando  Stat  — >  Basic  Statistics  —>  Co¬ 
rrelation  para  obtener  el  valor  del  coeficiente  de  correlation  r.  Compruebe  que  la  caja 
marcada  “Display  p-values”  tenga  una  marca.  La  salida  para  este  comando  (usando  los 
datos  de  prueba/calificacion)  se  ilustra  en  la  figura  12.24.  Observe  que  el  valor  p  para 
la  prueba  de  H0 :  p  =  0  sea  identica  al  valor  p  para  la  prueba  de  H0  :  (3  =  0  porque  las 
pruebas  son  exactamente  equivalentes. 


FIGURA  1  2.24 


EJercicios  suplementarios 

datos  12.58  Potencia  de  un  antibiotico  Se 

realizo  un  experimento  para  observar  el  efecto 
de  un  aumento  de  temperatura  en  la  potencia  de  un 
antibiotico.  Tres  porciones  de  una  onza  del  antibiotico 
se  almacenaron  durante  tiempos  iguales  a  estas 
temperaturas:  30°,  50°,  70°  y  90°.  Las  lecturas  de  potencia 
observada  a  cada  una  de  estas  temperaturas  del  periodo 
experimental  se  indican  a  continuation: 


Lecturas  de  potencia,  y 

38,  43,  29 

32,  26,  33 

19,  27,23 

14,  19,21 

Temperatura,  x 

30° 

50° 

70° 

90° 

Use  un  programa  de  computo  apropiado  para  contestar 

estas  preguntas: 

a.  Encuentre  la  recta  de  mfnimos  cuadrados  apropiada 
para  estos  datos. 

b.  Grafique  los  puntos  y  trace  la  recta  como  prueba  en 
sus  calculos. 

c.  Construya  una  tabla  ANOVA  para  regresion  lineal. 

d.  Si  dispone  de  ellas,  examine  las  graficas  de 
diagnostico  para  comprobar  la  validez  de  las 
suposiciones  de  regresion. 


e.  Estime  el  cambio  en  potencia  para  un  cambio  de  1 
unidad  en  temperatura.  Use  un  intervalo  de  confianza 
de  95%. 

f.  Estime  el  promedio  de  potencia  correspondiente  a  una 
temperatura  de  50°.  Use  un  intervalo  de  confianza  de 
95%. 

g.  Suponga  que  un  lote  del  antibiotico  fue  almacenado 
a  50°  durante  el  mismo  tiempo  que  el  periodo 
experimental.  Prediga  la  potencia  del  lote  al 
termino  del  periodo  de  almacenamiento.  Use  un 
intervalo  de  prediccion  de  95%. 

datos  12.59  Ciencia  en  plantas  Se  realizo  un 
experimento  para  determinar  el  efecto  en  el 
suelo,  de  aplicaciones  de  varios  niveles  de  fosforo,  en  los 
niveles  de  fosforo  inorganico  en  una  planta  particular. 
Los  datos  de  la  tabla  representan  los  niveles  de  fosforo 
inorganico  en  micromoles  (/xmol  )  por  gramo  de  peso 
en  seco  de  rafces  de  pasto  de  Sudan,  producidas  en 
invernadero  durante  28  dfas,  en  ausencia  de  zinc. 

Use  la  salida  impresa  MINITAB  para  contestar  las 
preguntas. 
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Fosforo  aplicado,  x  Fosforo  en  planta,  y 
.5  /nmol  204 

195 
247 
245 

.25  /Ltmol  159 

127 
95 
144 

.10  /nmol  128 

192 
84 
71 

a.  Grafique  los  datos.  ^Le  parece  que  los  datos  exhiben 
una  relacion  lineal? 

b.  Encuentre  la  recta  de  rm'nimos  cuadrados  que 
relacione  los  niveles  y  de  fosforo  en  planta  con  la 
cantidad  x  de  fosforo  aplicado  al  suelo.  Grafique 
la  recta  de  mfnimos  cuadrados  como  prueba  de  su 
respuesta. 

c.  pLos  datos  dan  suficiente  evidencia  para  indicar 
que  la  cantidad  de  fosforo  presente  en  la  planta  esta 
linealmente  relacionada  con  la  cantidad  de  fosforo 
aplicado  al  suelo? 

d.  Estime  la  cantidad  media  de  fosforo  en  la  planta  si 
.20  /nmol  de  fosforo  se  aplica  al  suelo,  en  ausencia  de 
zinc.  Use  un  intervalo  de  confianza  de  90%. 

Salida  impresa  MINITAB  para  el  ejercicio  12.59 

Analisis  de  regresion:  y  versus  x 

The  regression  equation  is 
y  =  80.9  +  271  x 

Predictor  Coef  SE  Coef  T  P 

Constant  80.85  22.40  3.61  0.005 

x  270.82  68.31  3.96  0.003 

S  =  39.0419  R-Sq  =  61.1%  R-Sq(adj)  =  57.2% 

Predicted  Values  for  New  Observations 

New  Obs  Fit  SE  Fit  90.0%  Cl  90.0%  PI 

1  135.0  12.6  (112.1,  157.9)  (60.6,  209.4) 

Values  of  Predictors  for  New  Observations 
New  Obs  x 

1  0.200 

!^) datos  12.60  Estadi'sticas  de  pista  Serealizo 
un  experimento  para  investigar  el  efecto  de 
un  programa  de  entrenamiento  a  lo  largo  del  tiempo 
para  que  un  estudiante  universitario  tipico  complete  la 
carrera  de  100  yardas.  Nueve  estudiantes  se  pusieron  en 
el  programa.  La  reduccion  y  en  el  tiempo  para  completar 
la  carrera  de  100  yardas  se  midio  para  tres  estudiantes 
y,  al  termino  de  dos  semanas,  para  tres  al  termino 
de  4  semanas  y  para  tres  al  termino  de  6  semanas  de 
entrenamiento.  Los  datos  se  dan  en  la  tabla  siguiente: 


Reduccion  en  tiempo,  y[ s) 

1.6,  .8,  1.0 

2.1,  1.6,  2.5 

3.8,27,3.1 

Tiempo  entrenamiento, 
x(semanas) 

2 

4 

6 

Use  un  paquete  de  software  apropiado  para  analizar  estos 
datos.  Exprese  cualesquiera  conclusiones  que  pueda 
sacar. 

(^) datos  12.61  Nematodos  Algunas  variedades 
de  nematodos,  gusanos  que  viven  en  el  suelo 
y  suelen  ser  tan  pequenos  que  son  invisibles  a  simple 
vista,  se  alimentan  de  rafces  de  hojas  de  pasto  y  de  otras 
plantas.  Esta  plaga,  que  es  particularmente  molesta  en 
climas  calidos,  puede  ser  tratada  por  la  aplicacion  de 
nematicidas.  Los  datos  recolectados  sobre  el  porcentaje 
de  nematodos  muertos  por  varios  rangos  de  aplicacion 
(dosis  dadas  en  libras  por  acre  de  ingrediente  activo)  son 
como  sigue: 


Rango  de  aplicacion,  x 

2 

3 

4 

5 

Porcentaje  muertos,  y 

50,  56,  48 

63,  69, 71 

86,  82,  76 

94,  99,  97 

Graficas  MINITAB  de  diagnostic  para  el  ejercicio  12.61 


Use  la  salida  impresa  apropiada  para  contestar  estas 
preguntas: 

a.  Calcule  el  coeficiente  de  correlacion  r  entre 
porcentajes  de  aplicacion  x  y  porcentaje  de  muertes  y. 

b.  Calcule  el  coeficiente  de  determinacion  r2  e  interprete. 

c.  Ajuste  una  recta  de  iru'nimos  cuadrados  a  los  datos. 

d.  Supongamos  que  usted  desea  estimar  el  porcentaje 
medio  de  muertes  para  una  aplicacion  de  4  libras  del 
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nematicida  por  acre.  (jQue  nos  dicen  las  grafi- 
cas  de  diagnostico  MINITAB  acerca  de  la  validez  de 
las  suposiciones  de  regresion?  /  Cuales  suposiciones 
pueden  haber  sido  violadas?  (-,Pucde  explicar  por  que? 

12.62  Lesiones  en  rodillas  Es  frecuente  que 
algunos  atletas  y  otras  personas  que  sufren  del  mismo 
tipo  de  lesiones  en  las  rodillas,  requieran  reconstruccion 
del  ligamento  anterior  y  posterior.  Para  determinar 
la  longitud  apropiada  de  injertos  entre  hueso,  tendon 
rotuliano  y  otra  vez  hueso,  se  realizaron  experimentos 
con  el  uso  de  tres  tecnicas  de  imagenes  para  determinar 
la  longitud  necesaria  de  los  injertos  y  estos  resultados  se 
compararon  con  la  longitud  real  requerida.  Un  resumen 
de  los  resultados  de  un  analisis  de  regresion  lineal  simple, 
para  cada  uno  de  estos  tres  metodos,  se  da  en  la  tabla 
siguiente.15 


Tecnica 
de  imagen 

Coeficiente 
de  determi¬ 
nacion,  r2 

Punto  de 
interseccion 

Pendiente 

Valor  p 

Radiograffas 

0.80 

-3.75 

1.031 

<0.0001 

Resonancia 

magnetica  estandar 

0.43 

20.29 

0.497 

0.011 

Resonancia  magne- 

tica  tridimensional 

0.65 

1.80 

0.977 

<0.0001 

a.  ^Que  se  puede  decir  acerca  de  la  signibcancia  de  cada 
uno  de  los  tres  analisis  de  regresion? 

b.  (',C6mo  se  clasihcarfa  la  efectividad  de  los  tres  analisis 
de  regresion?  7,  Cual  es  la  base  de  su  decision? 

c.  ^Como  se  comparan  los  valores  de  r2  y  valores  p  para 
determinar  el  mejor  pronosticador  de  longitudes  rea¬ 
les  de  injerto  de  ligamento  requerido? 

©  datos  12.63  Examenes  de  aprovechamiento  II 

Consulte  el  ejercicio  12.11  y  el  conjunto 
de  datos  EX121 1  respecto  a  la  relacion  entre  el 
Indice  de  Aprovechamiento  Academico  (API),  una 
medida  del  aprovechamiento  escolar  basada  en  los 
resultados  del  examen  Stanford  9  Achievement  y 
el  porcentaje  de  estudiantes  que  son  considerados 
Estudiantes  del  Idioma  Ingles  (ELL).  La  tabla  siguiente 
muestra  el  API  para  ocho  escuelas  elementales  en  el 
condado  de  Riverside,  California,  junto  con  el  porcentaje 
de  estudiantes  en  esa  escuela  que  son  considerados 
Estudiantes  del  Idioma  Ingles.3 
Escuela  1  2  3  4  5  6  7  8 

API  588  659  710  657  669  641  557  743 

ELL  58  22  14  30  11  26  39  6 

a.  Use  un  programa  apropiado  para  analizar  la  relacion 
entre  API  y  ELL. 

b.  Explique  todos  los  detalles  pertinentes  en  su  analisis. 

12.64  ^Que  tan  largo  es?  Consulte  el  ejercicio 
12.12  y  el  conjunto  de  datos  EX1212  respecto  a  la 


capacidad  de  una  persona  para  estimar  tamanos.  La  tabla 
siguiente  da  las  longitudes  estimadas  y  reales  de  los 
objetos  especibcados. 

Objeto  Estimado  (pulgadas)  Real  (pulgadas) 


Lapiz 

7.00 

6.00 

Plato  de  comida 

9.50 

10.25 

Libra  1 

7.50 

6.75 

Telefono  celular 

4.00 

4.25 

Fotograffa 

14.50 

15.75 

Juguete 

3.75 

5.00 

Cinturon 

42.00 

41.50 

Pinza  para  ropa 

2.75 

3.75 

Libra  2 

10.00 

9.25 

Calculadora 

3.50 

4.75 

a.  Use  un  programa  apropiado  para  analizar  la  relacion 
entre  las  longitudes  real  y  estimada  de  los  objetos 
citados. 


b.  Explique  todos  los  detalles  pertinentes  de  su  analisis. 

(^)datos  12.65  Tenis,  £quiere  jugar?  Siusted 

juega  tenis,  sabe  que  las  raquetas  vanan  en  sus 
caracterfsticas  ffsicas.  Los  datos  de  la  tabla  siguiente 
dan  medidas  de  rigidez  al  doblamiento  y  rigidez  a  la 
torcedura,  medidas  por  pruebas  de  ingenierfa  para  1 2 
raquetas  de  tenis: 


Raqueta 

Rigidez  al 
doblamiento,  x 

Rigidez  a  la 
torcedura,  y 

1 

419 

227 

2 

407 

231 

3 

363 

200 

4 

360 

211 

5 

257 

182 

6 

622 

304 

7 

424 

384 

8 

359 

194 

9 

346 

158 

10 

556 

225 

11 

474 

305 

12 

441 

235 

a.  Si  una  raqueta  tiene  rigidez  al  doblamiento,  ^tambien 
es  probable  que  tenga  rigidez  a  la  torcedura?  7L0S 
datos  dan  evidencia  de  que  x  y  y  estan  correlacionados 
positivamente? 

b.  Calcule  el  coebciente  de  determination  r2  e  interprete 
su  valor. 

^)datos  12.66  Investigation  del  aguacate  El 

movimiento  de  aguacates  en  Estados  Unidos, 
desde  ciertos  lugares,  esta  prohibido  debido  a  la 
posibilidad  de  introducir  moscas  de  la  fruta  al  pals 
con  los  embarques  de  aguacate.  No  obstante,  ciertas 
variedades  de  aguacate  supuestamente  son  resistentes  a 
la  infesta  de  moscas  de  la  fruta  antes  de  ablandarse  como 
resultado  de  su  madurez.  Los  datos  de  la  tabla  siguiente 
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resultaron  de  un  experimento  en  el  que  aguacates 
que  iban  de  1  a  9  dfas  despues  de  cosecharse  fueron 
expuestos  a  la  mosca  de  la  fruta  del  Mediterraneo.  La 
penetrabilidad  de  los  aguacates  se  midio  en  el  dfa  de 
su  exposicion,  evaluandose  el  porcentaje  de  aguacates 
infestados. 


Dias  despues  de  cosecha 

Penetrabilidad 

Porcentaje  infestado 

1 

.91 

30 

2 

.81 

40 

4 

.95 

45 

5 

1.04 

57 

6 

1.22 

60 

7 

1.38 

75 

9 

1.77 

100 

Use  la  salida  impresa  MINITAB  de  la  regresion  del 
porcentaje  infestado  (y)  en  dfas  despues  de  cosecha 
(. x ),  para  analizar  la  relacion  entre  estas  dos  variables. 
Explique  todas  las  partes  pertinentes  de  la  salida  impresa 
e  interprete  los  resultados  de  cualesquiera  pruebas. 

Salida  impresa  MINITABpara  el  ejercicio  12.66 
Analisis  de  regresion:  Porcentaje  versus  x 


The  regression 

equation 

is 

Percent  =  18.4 

+  8.18  x 

Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

18.427 

5 . 110 

3.61 

0 . 015 

X 

8 . 1768 

0.9285 

8 . 81 

0 . 000 

S  =  6.35552 

R-Sq  = 

93 . 9% 

R-Sq(adj)  = 

:  92 

.  7% 

Analysis  of  Variance 

Source 

DF 

SS 

MS 

F 

P 

Regression 

1 

3132.9 

3132.9  77. 

56 

0.000 

Residual  Error 

5 

202 . 0 

40.4 

Total 

6 

3334.9 

12.67  Aguacates  I  Consulte  el  ejercicio  12.66. 
Suponga  que  el  experimentador  desea  examinar  la 
relacion  entre  la  penetrabilidad  y  el  numero  de  dfas 
despues  de  la  cosecha.  (jLI  metodo  de  regresion  lineal 
estudiado  en  este  capftulo  es  un  metodo  apropiado 
de  analisis?  Si  no  es  asf,  (',que  suposiciones  han  sido 
violadas?  Use  las  graficas  de  diagnostico  MINITAB 
proporcionadas. 


Graficas  de  diagnostico  MINITABpara  el  ejercicio  12.67 


Residuales  versus  valores  ajustados 
(la  respuesta  es  penetrabilidad) 

0.20-1 - 

0.15- 

0.10- 
1  0.05- 

d  o.oo - 

-0.05- 

-0.10-  . 

H - 1 - 1 - 1 - 1 - 1 — 

0.6  0.8  1.0  1.2  1.4  1.6 

Valor  ajustado 

(^)datos  12.68  Metabolismo  y  aumento  de 

peso  pPor  que  razon  una  persona  puede 
tender  a  aumentar  de  peso,  incluso  si  no  come  mas  y 
se  ejercita  no  menos  que  un  amigo  delgado?  Estudios 
recientes  sugieren  que  los  factores  que  controlan  el 
metabolismo  pueden  depender  de  su  estructura  genetica. 
Un  estudio  comprendio  1 1  pares  de  gemelos  identicos 
alimentados  con  mil  calorfas  al  dfa  mas  de  lo  necesario 
para  mantener  un  peso  inicial.  Las  actividades  se 
mantuvieron  constantes  y  el  ejercicio  fue  mfnimo.  Al 
termino  de  100  dfas,  los  cambios  en  peso  corporal  (en 
kilogramos)  se  registraron  para  los  22  gemelos.16  <j,Hay 
una  correlacion  positiva  significativa  entre  los  cambios 
en  peso  corporal  para  los  gemelos?  ^Se  puede  concluir 
que  esta  similitud  es  causada  por  semejanzas  geneticas? 
Explique. 


Par 

Gemelo  A 

Gemelo  B 

1 

4.2 

7.3 

2 

5.5 

6.5 

3 

7.1 

5.7 

4 

7.0 

7.2 

5 

7.8 

7.9 

6 

8.2 

6.4 

7 

8.2 

6.5 

8 

9.1 

8.2 

9 

11.5 

6.0 

10 

11.2 

13.7 

11 

13.0 

11.0 

(ijjpi  DATOS 

12.69  Repaso  de  pelfculas  ^Cuantas 

EX1269 

semanas 

puede  exhibirse  una  pelfcula  y  todavfa 

tener  utilidades  razonables?  Los  datos  que  siguen 
muestran  el  numero  de  semanas  en  exhibition  (x)  y  la 
suma  total  a  la  fecha  (y)  para  las  mejores  10  pelfculas 
durante  una  semana  reciente.17 
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Pellcula 

Suma  total 
a  la  fecha 
(en  millones) 

Semanas  en 
exhibicion 

1.  The  Prestige 

$14.8 

1 

2.  The  Departed 

$77.1 

3 

3.  Flags  of  Our  Fathers 

$10.2 

1 

4.  Open  Season 

$69.6 

4 

5.  Flicka 

$7.7 

1 

6.  The  Grudge  2 

$31.4 

2 

1.  Man  of  the  Year 

$22.5 

2 

8.  Marie  Antoinette 

$5.3 

1 

9.  The  Texas  Chainsaw  Massacre: 

$36.0 

3 

The  Beginning 

10.  The  Marine 

$12.5 

2 

Fuente:  Entertainment  Weekly 

a.  Grafique  los  puntos  en  una  grafica  de  dispersion.  0  Le 
parece  que  la  relacion  entre  x  y  y  es  lineal?  ^Como 
describiria  usted  la  direccion  y  fuerza  de  la  relacion? 

b.  Calcule  el  valor  de  r2.  yQue  porcentaje  de  la  poblacion 
general  se  explica  al  usar  el  modelo  lineal  en  lugar  de 
y  para  predecir  la  variable  de  respuesta  y? 

c.  ^Cual  es  la  ecuacion  de  regresion?  ^Los  datos  dan 
evidencia  para  indicar  que  x  y  y  estan  relacionados 
linealmente?  Pruebe  usando  un  nivel  de  significancia 
de  5%. 

d.  Dados  los  resultados  de  los  incisos  b)  y  c),  ^es 
apropiado  usar  la  recta  de  regresion  para  estimar  y 
predecir?  Explique  su  respuesta. 

12.70  Ademas  de  limites  cada  vez  mas  grandes  en 
el  error,  ^por  que  un  experimentador  debe  abstenerse 
de  predecir  y  para  valores  de  x  fuera  de  la  region 
experimental? 

12.71  Si  el  experimentador  continua  dentro  de  la  region 
experimental,  ^cuando  sera  maximo  el  error  al  predecir 
un  valor  particular  de  y? 

(^)datos  12.72  Avena,  ialguien  quiere?  Un 

experimentador  agricola,  investigando  el  efecto 
de  la  cantidad  de  nitrogeno  x  aplicada  en  100  libras  por 
acre  en  la  produccion  de  avena  y,  medida  en  bushels 
por  acre,  recolecto  los  siguientes  datos: 


X 

i 

2 

3 

4 

V 

22 

38 

57 

68 

19 

41 

54 

65 

a.  Encuentre  la  recta  de  minimos  cuadrados  para  los 
datos. 

b.  Construya  la  tabla  ANOVA. 

c.  ^Hay  suficiente  evidencia  para  indicar  que  la 
produccion  de  avena  esta  linealmente  relacionada  con 
la  cantidad  de  nitrogeno  aplicada?  Use  a  =  .05. 

d.  Prediga  la  produccion  esperada  de  avena  con  95%  de 
confianza  si  se  aplican  250  libras  de  nitrogeno. 


e.  Estime  el  promedio  de  aumento  en  produccion  para  un 
aumento  de  100  libras  de  nitrogeno  por  acre  con  99% 
de  confianza. 

f.  Calcule  r2  y  explique  su  significancia  en  terminos  de 
predecir  y,  la  produccion  de  avena. 

(^) datos  12.73  Rosas  frescas  Un  horticultor  invento 
una  escala  para  medir  la  frescura  de  rosas  que 
fueron  empacadas  y  almacenadas  durante  periodos 
variables  antes  de  trasplantarlas.  La  medicion  y  de 
frescura  y  el  tiempo  x  en  dfas  que  la  rosa  esta  empacada  y 
almacenada  antes  de  trasplantarla,  se  dan  a  continuation. 


X 

5 

10 

15 

20 

25 

V 

15.3 

13.6 

9.8 

5.5 

1.8 

16.8 

13.8 

8.7 

4.7 

1.0 

a.  Ajuste  una  recta  de  minimos  cuadrados  a  los  datos. 

b.  Construya  la  tabla  ANOVA. 

c.  7,  Hay  suficiente  evidencia  para  indicar  que  la  frescura 
esta  linealmente  relacionada  con  el  tiempo  de 
almacenaje?  Use  a  =  .05. 

d.  Estime  la  rapidez  media  de  cambio  en  frescura  para  un 
aumento  de  un  dia  en  tiempo  de  almacenaje,  usando 
un  intervalo  de  confianza  de  98%. 

e.  Estime  la  medicion  esperada  de  frescura  para  un 
tiempo  de  almacenaje  de  14  dfas  con  un  intervalo  de 
confianza  de  95%. 

f.  (:,De  que  valor  es  el  modelo  lineal  con  respecto  a  y 
para  predecir  la  frescura? 

datos  12.74  Lexus,  Inc.  Los  fabricantes  del 

automovil  Lexus  han  aumentado  continuamente 
sus  ventas  desde  que  lanzaron  su  auto  en  1989  en  Estados 
Unidos.  No  obstante,  la  rapidez  de  aumento  cambio  en 
1996  cuando  Lexus  introdujo  una  lfnea  de  camiones.  Las 
ventas  de  Lexus  de  1996  a  2005  se  indican  en  la  tabla 
siguiente:18 


Ano 

1996 

1997 

1998 

1999 

2000 

2001 

2002 

2003 

2004 

2005 

Ventas 

80 

100 

155 

180 

210 

224 

234 

260 

288 

303 

(miles  de 
vehiculos) 

Fuente:  Adaptado  de:  Automotive  News,  26  de  enero  2004  y  22  de  mayo  2006 

a.  Trace  los  puntos  usando  una  grafica  de  dispersion. 

7,  Como  describiria  usted  la  relacion  entre  ano  y  ventas 
del  Lexus? 

b.  Encuentre  la  recta  de  regresion  de  minimos  cuadrados 
que  relacione  las  ventas  del  Lexus  y  el  ano  que  se 
mida. 

c.  7,  Hay  suficiente  evidencia  para  indicar  que  las  ventas 
estan  linealmente  relacionadas  con  el  ano?  Use  a  = 

.05. 
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d.  Prediga  las  ventas  del  Lexus  para  el  ano  2006  usando 
un  intervalo  de  confianza  de  95%. 

e.  Si  las  hay,  examine  las  graficas  de  diagnostico  para 
verificar  la  validez  de  las  suposiciones  de  regresion. 

f.  Si  fuera  usted  a  predecir  las  ventas  del  Lexus  en 
el  ano  2015,  (',que  problemas  podrfan  surgir  con  su 
prediccion? 

datos  12.75  Starbucks  Veamos  a  continuation 
algunos  datos  nutrimentales  para  un  muestreo 
de  productos  Starbucks  (16  onzas  lfquidas),  tomadas 
del  sitio  web  de  la  compafua,  www.starbucks.com.19  El 
conjunto  complete  de  datos  (starbucks. mtp)  se  puede 
hallar  con  los  otros  conjuntos  de  datos  en  el  sitio  web 
Student  Companion. 

Pantalla  de  datos 


Row  Product 

Calories 

Fat 

Calories 

1 

CaffeMocha -nowhip 

300 

110 

2 

CaramelFrappuccino® 

280 

30 

3 

BlendedCof fee -nowhip 
ChocolateBrownie 

370 

80 

4 

Frappuccino® 

BlendedCof fee -nowhip 
ChocolateMalt 

610 

200 

5 

Frappuccino® 
BlendedCreme-whip 
EggnogLa 1 1  e - nowhip 

410 

180 

6 

Hot Chocolate -nowhip 

340 

140 

7 

IcedCaf f eMocha-whip 

350 

180 

8 

IcedWhiteChocolate 

490 

210 

9 

Mocha -whip 
MochaFrappuccino® 

420 

150 

10 

BlendedCof fee -whip 
PeppermintMocha -nowhip 

370 

110 

11 

Tazo®ChaiCreme 

370 

40 

12 

Frappuccino® 

B 1 endedTea - nowhip 
ToffeeNut Creme -whip 

460 

220 

13 

ToffeNutLatte -nowhip 

330 

120 

14 

Vani 1 laFrappucc ino® 

480 

150 

15 

BlendedCreme-whip 
WhiteHot Chocolate -whip 

580 

250 

Pantalla  de  datos  (continuacion) 


Row 

Total 

Fat 

(g) 

Saturated 
Fat  (g) 

Cholesterol  (mg) 

1 

12 . 0 

7 

40 

2 

3 . 5 

2 

15 

3 

9.0 

6 

15 

4 

22 . 0 

11 

65 

5 

20.0 

12 

115 

6 

15.0 

8 

50 

7 

20.0 

12 

75 

8 

24 . 0 

16 

75 

9 

16 . 0 

10 

65 

10 

12 . 0 

6 

40 

11 

4 . 5 

1 

<5 

12 

24 . 0 

15 

100 

13 

13.0 

8 

50 

14 

17 . 0 

9 

55 

15 

28 . 0 

19 

95 

Total 

Row 

Sodium 

Carbs 

Fiber 

Sugar 

Protein 

(mg) 

(g) 

(g) 

(g) 

(g) 

1 

150 

41 

2 

31 

13 

2 

250 

57 

0 

48 

5 

3 

310 

69 

2 

56 

7 

4 

430 

90 

2 

72 

15 

5 

240 

41 

0 

38 

17 

6 

190 

42 

2 

35 

15 

7 

105 

37 

2 

27 

9 

8 

220 

58 

0 

54 

11 

9 

260 

61 

0 

51 

6 

10 

150 

59 

2 

49 

13 

11 

370 

69 

0 

64 

15 

12 

380 

45 

0 

44 

14 

13 

340 

41 

0 

38 

13 

14 

380 

66 

0 

62 

15 

15 

310 

65 

0 

64 

17 

Use  los  metodos  estadisticos  apropiados  para  analizar  las 
relaciones  entre  algunas  de  las  variables  nutrimentales 
dadas  en  la  tabla.  Escriba  un  informe  en  resumen  que 
explique  algunas  conclusiones  que  pueda  sacar  de  su 
analisis. 
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APPLET 


Usted  puede  hacer  recordatorio  sobre  rectas  de  regresion 
y  el  coeficiente  de  correlacion  si  hace  los  Ejercicios 
Mi- Applet  del  final  del  capitulo  3. 

12.76  a.  Graft que  la  recta  correspondiente  a  la 

ecuacion  y  =  0.5a:  +  3  al  graficar  los  puntos 
correspondientes  a  x  =  0,  1  y  2.  De  el  punto 
de  interseccion  con  el  eje  y  y  la  pendiente  de 
la  recta. 

b.  Verifique  su  grafica  usando  el  applet  How  a  Line 
Works. 

12.77  a.  Grafique  la  recta  correspondiente  a  la 

ecuacion  y  =  —0.5a  +  3  al  graficar  los  puntos 
correspondientes  ax  =  0,  1  y  2.  De  el  punto 
de  cruce  con  el  eje  y  y  la  pendiente  de  la  recta. 

b.  Verifique  su  grafica  usando  el  applet  How  a  Line 
Works. 

c.  ^Como  esta  relacionada  esta  recta  con  la  recta 
y  =  0.5x  +  3  del  ejercicio  12.76? 

12.78  La  salida  impresa  MINITAB  para  los  datos  de  la 
tabla  12.1  se  muestra  a  continuacion. 


Salida  impresa  MINITAB  para  el  ejercicio  12.78. 

Analisis  de  regresion:  y  versus  x 


The  regression  equation  is 
y  =  40.8  +  0.766  x 


Predictor 

Constant 

x 


Coef  SE  Coef 
40.784  8.507 
0.7656  0.1750 


T  P 
4.79  0.001 
4.38  0.002 


S  =  8.70363 


R-Sq  =  70.5% 


R-Sq(adj)  =  66.8% 


Analysis  of  Variance 


Source  DF 
Regression  1 
Residual  Error  8 
Total  9 


SS  MS  F  P 

1450.0  1450.0  19.14  0.002 

606.0  75.8 

2056 . 0 


a.  Use  el  applet  Method  of  Least  Squares  para  hallar 
los  valores  de  ay  b  que  determinan  la  recta  de  mejor 
ajuste,  y  =  a  +  bx.  Cuando  piense  que  ha  reducido 
SSE  al  nunimo,  de  un  clic  en  el  boton  ]  C8  y  vea 
que  tan  bien  la  hizo.  ^Cual  es  la  ecuacion  de  la  recta? 
<\Se  compara  con  la  ecuacion  de  regresion  dada  en  la 
salida  impresa  MINITABT 


b.  Encuentre  los  valores  de  SSE  y  r  en  el  applet  Method 
of  Least  Squares.  Encuentre  estos  valores  en  la  salida 
impresa  MINITAB  y  confirme  que  sean  iguales. 

c.  Use  los  valores  de  b  y  su  error  estandar  SE (b)  de  la 
salida  impresa  MINITAB  junto  con  el  applet  t-Test  for 
the  Slope  para  verificar  el  valor  de  la  estadfstica  t  y  su 
valor  p,  dado  en  la  salida  impresa. 

12.79  Use  el  primer  applet  en  Building  a  Scatterplot 

para  crear  una  grafica  de  dispersion  para  los  datos  de  la 
tabla  12.1.  Verifique  su  grafica  usando  la  figura  12.2. 

(^)oatos  12.80  Zapatostenis  t,Su  satisfaction 
EX1274  general  con  su  nuevo  par  de  zapatos  tenis 
esta  correlacionada  con  el  costo  de  los  zapatos?  Las 
puntuaciones  de  satisfaction  y  precios  se  registraron  para 
nueve  diferentes  estilos  y  marcas  de  tenis  para  hombre, 
con  los  siguientes  resultados:20 


Marca  y  estilo 

Precio 

Puntos 

New  Balance  MW  791 

$75 

89 

Saucony  Grid  Omni  Walker 

90 

84 

Asics  Gel-Walk  Tech 

BO 

83 

New  Balance  MW  557 

BO 

83 

Etonic  Lite  Walker 

BO 

79 

Nike  Air  Max  Healthwalker  V 

70 

78 

Rockport  Astride 

90 

75 

Rockport  WT  Classic 

90 

72 

Reebok  Move  DMX  Max 

BO 

67 

Fuente:  "Ratings:  Walking  Shoes",  Consumer  Reports,  octubre  de  2006,  p.  52. 


a.  Calcule  el  coeficiente  de  correlacion  r  entre  precio  y 
puntos  generales.  ^Como  describirfa  usted  la  relation 
entre  precio  y  puntos  generales? 

b.  Use  el  applet  llamado  Correlation  and  the 
Scatterplot  para  graficar  los  nueve  puntos.  yCual  es 
el  coeficiente  de  correlacion  mostrado  en  el  applet? 
Compare  con  el  valor  que  calculo  en  el  inciso  a). 

c.  Describa  la  forma  que  vea  en  la  grafica  de  dispersion. 
7,  Hay  algun  resultado  atipico?  Si  es  asi,  ycomo  lo 
explicarfa? 
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CASO 

prActico 

(^|  datos  Autos 

extranjeros 


tSu  auto  esta 


"Hecho  en  EE.UU."? 


La  frase  “Hecho  en  EE.UU.”  se  ha  convertido  en  un  conocido  grito  de  batalla  porque 
los  trabajadores  de  Estados  Unidos  tratan  de  proteger  sus  trabajos  de  la  competencia 
extranjera.  En  las  ultimas  decadas,  un  importante  desequilibrio  en  la  balanza  comer- 
cial  en  Estados  Unidos  ha  estado  causando  una  inundacion  de  productos  importados 
que  entran  al  pais  y  se  venden  a  menor  costo  que  artfculos  comparables  hechos  en  el. 
Una  preocupacion  principal  es  la  industria  automotriz,  en  la  que  el  numero  de  autos 
importados  aumento  continuamente  durante  las  decadas  de  1970  y  1980.  La  indus¬ 
tria  automotriz  de  ese  pals  ha  estado  siendo  acosada  con  quejas  por  la  calidad  de  sus 
productos,  despidos  de  trabajadores  y  altos  precios,  y  ha  gastado  miles  de  millones  de 
dolares  en  publicidad  e  investigacion  para  producir  un  auto  hecho  en  Estados  Unidos 
que  satisfaga  las  demandas  del  consumidor.  /  Han  tenido  exito  para  detener  la  inundacion 
de  autos  importados  comprados  por  consumidores  estadounidenses?  Los  datos  de  la  tabla 
siguiente  representan  los  numeros  de  autos  importados  y  vendidos  en  Estados  Unidos  (en 
millones)  durante  los  anos  1969-2005. 21  Para  simplificar  el  analisis,  hemos  codificado  el 
ano  usando  la  variable  codificada  x  =  Ano  -  1969. 


Ano 

(Ano  -  1969),  x 

Numero  de 
autos  importados,  y 

Ano 

(Ano  -  1969),  x 

Numero  de 
autos  importados,  y 

1969 

0 

1.1 

1987 

18 

3.1 

1970 

1 

1.3 

1988 

19 

3.1 

1971 

2 

1.6 

1989 

20 

2.8 

1972 

3 

1.6 

1990 

21 

2.5 

1973 

4 

1.8 

1991 

22 

2.1 

1974 

5 

1.4 

1992 

23 

2.0 

1975 

6 

1.6 

1993 

24 

1.8 

1976 

7 

1.5 

1994 

25 

1.8 

1977 

8 

2.1 

1995 

26 

1.6 

1978 

9 

2.0 

1996 

27 

1.4 

1979 

10 

2.3 

1997 

28 

1.4 

1980 

11 

2.4 

1998 

29 

1.4 

1981 

12 

2.3 

1999 

30 

1.8 

1982 

13 

2.2 

2000 

31 

2.1 

1983 

14 

2.4 

2001 

32 

2.2 

1984 

15 

2.4 

2002 

33 

2.3 

1985 

16 

2.8 

2003 

34 

2.2 

1986 

17 

3.2 

2004 

35 

2.2 

2005 

36 

2.3 

1.  Usando  una  grafica  de  dispersion,  grafique  los  datos  para  los  anos  1969-1988.  /, Lc 
parece  que  hay  una  relacion  lineal  entre  el  numero  de  autos  importados  y  el  ano? 

2.  Use  un  paquete  de  software  para  hallar  la  recta  de  rmnimos  cuadrados  para  predecir  el 
numero  de  autos  importados  como  funcion  del  ano  para  los  anos  1969-1988. 

3.  /.Hay  una  relacion  lineal  significativa  entre  el  numero  de  autos  importados  y  el  ano? 

4.  Use  el  programa  de  computo  para  predecir  el  numero  de  autos  que  seran  importados 
usando  intervalos  de  prediction  de  95%  para  cada  uno  de  los  anos  2003,  2004  y  2005. 

5.  Ahora  vea  los  datos  reales  para  los  anos  2003-2005.  /.Las  predicciones  obtenidas  en 
el  paso  4  dan  estimaciones  precisas  de  los  valores  reales  observados  en  estos  anos? 
Explique. 

6.  Agregue  los  datos  para  1989-2005  a  su  base  de  datos  y  recalcule  la  recta  de  regresion. 
/.Que  efecto  tienen  los  nuevos  puntos  sobre  la  pendiente?  /.Cual  es  el  efecto  en  el  SSE? 

7.  Dada  la  forma  de  la  grafica  de  dispersion  para  los  anos  1969-2005,  /.le  parece  que  una 
recta  da  un  modelo  preciso  para  los  datos?  /.Que  otro  tipo  de  modelo  podrfa  ser  mas 
apropiado?  (Use  graficas  residuales  para  ayudar  a  contestar  esta  pregunta.) 
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de  regresion 
multiple 
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OBJETIVO  GENERAL 

En  este  capitulo,  extendemos  los  conceptos  de  regresion 
y  correlacion  lineales  a  una  situacion  donde  el  valor 
promedio  de  una  variable  aleatoria  yesta  relacionada 
con  varias  variables  independientes,  que  son  x,, 
x2,  .  .  xk,  en  modelos  que  son  mas  flexibles  que  el 
modelo  de  recta  del  capitulo  12.  Con  el  analisis  de 
regresion  multiple,  podemos  usar  la  informacion 
proporcionada  por  las  variables  independientes  para 
ajustar  varios  tipos  de  modelos  a  los  datos  muestrales, 
para  evaluar  la  utilidad  de  estos  modelos  y  finalmente  para 
estimar  el  valor  promedio  de  yo  predecir  el  valor  real 
de  y  para  valores  dados  de  x1:  x2:  .  .  xk. 

INDICE  DEL  CAPITULO 

Ft 2  ajustada  (13.3) 

El  analisis  de  varianza  de  la  prueba  F  (1 3.3) 

Analisis  de  varianza  para  regresion  multiple  (13.3) 
Casualidad  y  multicolinealidad  (13.9) 

El  coeficiente  de  determinacion  F2(1 3.3) 

Estimacion  y  prediccion  usando  el  modelo 
de  regresion  (13.3) 

El  modelo  y  suposiciones  lineales  generales  (13.2) 

El  metodo  de  minimos  cuadrados  (13.3) 

Modelo  polinomial  de  regresion  (13.4) 

Variables  cualitativas  en  un  modelo  de  regresion  (13.5) 
Graficas  residuales  (13.3) 

Sumas  secuenciales  de  cuadrados  (13.3) 

Analisis  de  regresion  por  pasos  (13.8) 

Prueba  de  los  coeficientes  de  regresion  parcial  (13.3) 
Prueba  de  los  grupos  de  coeficientes  de  regresion  (13.6) 


"Hecho  en  EE.UU."; 
otra  mi  rad  a 

En  el  capitulo  12,  empleamos  analisis  de  regre¬ 
sion  lineal  simple  para  tratar  de  predecir  el  nu- 
mero  de  autos  importados  en  Estados  Unidos  en 
un  periodo  de  anos.  Desafortunadamente,  el  nii- 
mero  de  autos  importados  no  sigue  en  realidad  un 
modelo  de  tendencia  lineal  y  nuestras  prediccio- 
nes  estuvieron  lejos  de  ser  precisas.  Examinamos 
de  nuevo  los  mismos  datos  al  final  de  este  capf- 
tulo,  usando  los  metodos  de  analisis  de  regresion 
multiple. 
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INTRODUCCION 

La  regresion  lineal  multiple  es  una  extension  de  regresion  lineal  simple  para  tomar  en 
cuenta  mas  de  una  variable  independiente.  Esto  es,  en  lugar  de  usar  solo  una  variable 
independiente  x  para  explicar  la  variation  en  y,  se  pueden  usar  simultaneamente  varias 
variables  independientes  (o  elementos  de  prediction).  Con  el  uso  de  mas  de  una  variable 
independiente,  se  debe  hacer  un  mejor  trabajo  de  explicar  la  variation  en  y  y  en  conse- 
cuencia  hacer  predicciones  mas  precisas. 

Por  ejemplo,  las  ventas  regionales  y  del  producto  de  una  compama  podrfan  estar  rela- 
cionadas  con  tres  factores: 


•  xp  la  cantidad  gastada  en  publicidad  en  television 

•  x-;.  la  cantidad  gastada  en  publicidad  en  periodicos 

•  x3:  el  numero  de  vendedores  asignados  a  la  region 


Un  investigador  recolectarfa  datos  para  medir  las  variables  y:  xh  x2  y  x:h  y  luego  usaria 
estos  datos  muestrales  para  construir  una  ecuacion  de  prediction  que  relacionara  y  con 
las  tres  variables  predictoras.  Desde  luego  que  aparecen  varias  preguntas,  al  igual  que 
con  regresion  lineal  simple: 

•  ^Que  tan  bien  se  ajusta  el  modelo? 

•  ^Que  tan  fuerte  es  la  relation  entre  y  y  las  variables  predictoras? 

•  i Se  han  violado  suposiciones  importantes? 

•  ^Que  tan  buenas  son  las  estimaciones  y  predicciones? 

Para  contestar  estas  preguntas  se  pueden  usar  metodos  de  analisis  de  regresion  multi¬ 
ple,  que  casi  siempre  se  hacen  con  un  programa  de  computo.  Este  capitulo  contiene  una 
breve  introduction  al  analisis  de  regresion  multiple  y  a  la  dificil  tarea  de  construction  de 
modelos,  es  decir,  escoger  el  modelo  correcto  para  una  aplicacion  practica. 


EL  MODELO  DE  REGRESION  MULTIPLE 

El  modelo  de  regresion  multiple  para  un  analisis  de  regresion  multiple  describe  una 
respuesta  particular  y  usando  el  modelo  que  damos  a  continuation. 


MODELO  Y  SUPOSICIONES  LINEALES  GENERALES 

y  =  P  o  +  PiXi  +  p2x2  +  •  ■  •  +  pkxk  +  e 
donde 

•  y  es  la  variable  de  respuesta  que  se  desea  predecir. 

•  jS0,  Pi,  p2,  ■  ■  ■,  Pk son  constantes  desconocidas. 

•  Xu  x2,  ■■■,xk  son  variables  predictoras  independientes  que  se  miden  sin  error. 

•  e  es  el  error  de  variable,  que  permite  que  cada  respuesta  se  desvie  del  valor 
promedio  de  y  en  una  cantidad  e.  Se  debe  suponer  que  los  valores  de  e:l)  son 
independientes;  2)  tienen  una  media  de  0  y  una  varianza  comun  er2  para  cualquier 
conjunto  xh  x2,  . . .,  xk,  y  3)  estan  normalmente  distribuidas. 

Cuando  se  satisfagan  estas  suposiciones  acerca  de  e,  el  valor  promedio  de  y  para  un 
conjunto  dado  de  valores  xh  x2,  ...,xk  es  igual  a  la  parte  determinista  del  modelo: 

E(y)  =  Po  +  P<X]  +  p2x2  +  ■  •  •  +  pkxk 
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Observe  que  el  modelo  y  suposiciones  de  regresion  simple  son  muy  semejantes  al  modelo 
y  suposiciones  empleados  para  regresion  lineal.  Es  probable  que  no  lo  sorprenda  el  que 
los  procedimientos  de  prueba  y  estimacion  tambien  sean  extensiones  de  los  empleados 
en  el  capitulo  12. 

Los  modelos  de  regresion  simple  son  muy  flexibles  y  pueden  tomar  muchas  formas, 
dependiendo  de  la  forma  en  que  las  variables  independientes  x\,  x2,  . . .,  xk  se  introduzcan 
en  el  modelo.  Empezamos  con  un  simple  modelo  de  regresion  multiple,  explicando  los 
conceptos  y  procedimientos  basicos  con  un  ejemplo.  A  medida  que  nos  familiarice- 
mos  con  los  procedimientos  de  regresion  multiple,  aumentamos  la  complej  idad  de  los  ejem- 
plos  y  veremos  que  los  mismos  procedimientos  se  pueden  usar  para  modelos  de  formas 
diferentes,  dependiendo  de  la  aplicacion  particular. 

Suponga  que  se  desea  relacionar  una  variable  aleatoria  y  con  dos  variables  independien¬ 
tes  xi  y  x2.  El  modelo  de  regresion  multiple  es 


y  =  Po  +  /3i*i  +  p2x2  +  e 


con  el  valor  medio  de  y  dado  como 


CONSEJO 


En  lugar  de  xy /graficadas 
en  un  espacio  en  dos 
dimensiones,  yy  xhx2, xt 
tienen  que  graficarse  en 
(k  +  1)  dimensiones. 


E(y)  =  jS0  +  jSiXj  +  p2x2 

Esta  ecuacion  es  una  extension  en  tres  dimensiones  de  la  recta  de  medias  del  capitulo 
12  y  traza  un  piano  en  el  espacio  tridimensional  (vease  la  figura  13.1).  La  constante 
Po  se  denomina  punto  de  cruce,  que  es  el  valor  promedio  de  y  cuando  x  y  x2  son  0 
ambas.  Los  coeficientes  /j  y  p2  se  denominan  pendientes  parciales  o  coeficientes  de 
regresion  parciales.  La  pendiente  parcial  j8;  (para  i  =  1  o  2)  mide  el  cambio  en  y  para 
un  cambio  unitario  en  x,  cuando  todas  las  otras  variables  independientes  se  mantengan 
constantes.  El  valor  del  coeficiente  de  regresion  parcial,  por  ejemplo  /3i,  con  x,  y  x2  en  el 
modelo  generalmente  no  es  igual  que  la  pendiente  cuando  se  ajuste  una  recta  solo  con  x,. 
Estos  coeficientes  son  las  constantes  desconocidas,  que  deben  ser  estimadas  usando 
datos  muestrales  para  obtener  la  ecuacion  de  prediction. 


UN  anAlisis  de  regresion  multiple 


Un  analisis  de  regresion  multiple  comprende  procedimientos  de  estimacion,  prueba  y 
diagnostico  disenados  para  ajustar  el  modelo  de  regresion  multiple 


E(y)  -  (} o  +  /3|X,  +  p2x2  +  •  ■  •  +  phxk 
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EJEM 


TABLA 


a  un  conjunto  de  datos.  Debido  a  la  complejidad  de  los  calculos  involucrados,  estos  pro- 
cedimientos  casi  siempre  se  ponen  en  practica  con  un  programa  de  regresion  de  uno  de 
los  varios  paquetes  de  software.  Todos  dan  resultados  similares  en  formas  ligeramente 
diferentes.  Seguimos  con  patrones  basicos  puestos  en  regresion  lineal  simple,  empe- 
zando  con  un  resumen  de  los  procedimientos  generales  e  ilustrados  con  un  ejemplo. 


l°  3- 


Observation 

Precio  de  lista,  y 

Area  de  vivienda,  x , 

Pisos,  x2 

Recamaras,  x3 

Banos,  x, 

1 

169.0 

6 

1 

2 

1 

2 

218.5 

10 

1 

2 

2 

3 

216.5 

10 

1 

3 

2 

4 

225.0 

11 

1 

3 

2 

5 

229.9 

13 

1 

3 

1.7 

6 

235.0 

13 

2 

3 

2.5 

7 

239.9 

13 

1 

3 

2 

8 

247.9 

17 

2 

3 

2.5 

9 

260.0 

19 

2 

3 

2 

10 

269.9 

18 

1 

3 

2 

11 

234.9 

13 

1 

4 

2 

12 

255.0 

18 

1 

4 

2 

13 

269.9 

17 

2 

4 

3 

14 

294.5 

20 

2 

4 

3 

15 

309.9 

21 

2 

4 

3 

El  metodo  de  mfnimos  cuadrados 

La  ecuacion  de  prediction 

y  =  b0  +  biXi  +  b2x2  +  •  •  •  +  bkxk 

es  la  recta  que  reduce  la  SSE  al  mmimo,  la  suma  de  cuadrados  de  las  desviaciones  de  los 
valores  y  observados  en  los  valores  pronosticados  y.  Estos  valores  se  calculan  usando  un 
programa  de  regresion. 

I  En  que  forma  los  vendedores  de  bienes  raices  determinan  el  precio  de  venta  para  un  con- 
dominio  recien  inscrito  en  lista?  La  base  de  datos  de  una  computadora  en  una  pequena 
comunidad  contiene  el  precio  de  venta  de  lista  y  (en  miles  de  dolares),  la  cantidad  de 
area  de  vivienda  x\  (en  cientos  de  pies  cuadrados),  asf  como  los  numeros  de  pisos  x2, 
recamaras  x2  y  banos  x4,  para  n  =  15  condominios  seleccionados  al  azar  actualmente  en 
el  mercado.  Los  datos  se  muestran  en  la  tabla  13.1. 

Datos  sobre  1  5  condominios 


El  modelo  de  regresion  multiple  es 

E(y)  =  Po  +  PM  +  (32x2  +  /33x3  +  (34x4 

que  se  ajusta  usando  el  paquete  de  software  MINITAB.  En  la  section  “Mi  MINITAB”,  al 
final  de  este  capitulo,  se  pueden  hallar  instrucciones  para  general-  esta  salida.  La  primera 
parte  de  la  salida  de  regresion  se  ve  en  la  figura  13.2.  Se  encontrara  la  ecuacion  de  regre¬ 
sion  ajustada  en  los  primeros  dos  renglones  de  la  salida  impresa: 

y  =  119  +  6.27 %  —  16.2x2  —  2.61  x2  +  30.3v4 

Los  coeficientes  de  regresion  parcial  se  muestran  con  ligeramente  mas  precision  en  la 
segunda  section.  Las  columnas  son  una  lista  del  nombre  dado  a  cada  variable  indepen- 
diente  de  pronostico,  su  coeficiente  de  regresion  estimado,  su  error  estandar  y  los  valores  t 
y  p  que  se  usan  para  probar  su  significancia  enpresencia  de  todas  las  otras  variables  pre- 
dictoras.  En  una  section  mas  adelante  explicamos  estas  pruebas  con  mas  detalle. 


www.FreeLibros.me 


13.3  UN  ANALISIS  DE  REGRESION  MULTIPLE 


O 


555 


FIGURA  13.2 

Parte  de  la  salida  impresa 
MINITAB  para  el  ejemplo 
13.2 


Analisis  de  regresion:  lista  de  precios  contra  pies  cuadrados, 
numero  de  pisos,  recamaras,  banos 

The  regression  equation  is 

List  Price  =  119  +  6.27  Square  Feet  -  16.2  Number  of  Floors 
-  2.67  Bedrooms  +  30.3  Baths 


Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

118 . 763 

9.207 

12 . 90 

0 . 000 

Square  Feet 

6.2698 

0 . 7252 

8.65 

0 . 000 

Number  of  Floors 

-16.203 

6.212 

-2 . 61 

0 . 026 

Bedrooms 

-2.673 

4.494 

-0 . 59 

0.565 

Baths 

30.271 

6 . 849 

4.42 

0 . 001 

FIGURA  13.3 

Parte  de  la  salida  impresa 
MINITAB  para  el  ejemplo 
13.2 


El  analisis  de  varianza  para  regresion 
multiple 

El  analisis  de  varianza  divide  la  variacion  total  en  la  variable  de  respuesta  y, 

SS  Total  =  Xy-  - 

n 

en  dos  partes: 

•  La  SSR  (suma  de  cuadrados  para  regresion)  mide  la  cantidad  de  variacion  expli- 
cada  usando  la  ecuacion  de  regresion. 

•  La  SSE  (suma  de  cuadrados  para  error)  mide  la  variacion  residual  en  los  datos 
que  no  esta  explicada  por  las  variables  independientes. 

de  modo  que 

SS  Total  =  SSR  +  SSE 

Los  grados  de  libertad  para  estas  sumas  de  cuadrados  se  encuentran  usando  el  siguiente 
argumento.  Hay  (n  —  1)  grados  de  libertad  en  total.  Estimar  la  recta  de  regresion  requie- 
re  estimar  k  coeficientes  desconocidos;  la  constante  b0  es  una  funcion  de  y  y  de  las  otras 
estimaciones.  En  consecuencia,  hay  k  grados  de  libertad  de  regresion,  dejando  (n  —  1) 
—  k  grados  de  libertad  para  error.  A1  igual  que  en  capitulos  previos,  las  medias  cuadra- 
ticas  se  calculan  como  MS  =  SS  /elf. 

La  tabla  ANOVA  para  los  datos  de  bienes  rafees  de  la  tabla  13.1  se  muestran  en  la 
segunda  parte  de  la  salida  impresa  MINITAB  en  la  figura  13.3.  Hay  n  =  15  observaciones 
y  k  =  4  variables  predictoras  independientes.  Se  puede  verificar  que  el  total  de  grados 
de  libertad,  (n  —  1)  =  14,  se  divide  en  k  =  4  para  regresion  y  (n  —  k  —  1 )  =  10  para 
error. 


S  =  6.84930 

R-. 

Sq  = 

97.1%  R-Sq(adj)  =  96.0% 

Analysis  of  Variance 

Source 

DF 

SS  MS  F 

Regression 

4 

15913.0  3978.3  84.80 

Residual  Error 

10 

469.1  46.9 

Total 

14 

16382.2 

Source 

DF 

Seq  SS 

Square  Feet 

1 

14829.3 

Number  of  Floors 

1 

0.9 

Bedrooms 

1 

166.4 

Baths 

1 

916.5 

La  mejor  estimacion  de  la  variable  aleatoria  er2  en  el  experimento,  es  decir  la  variacion 
que  no  es  explicada  por  las  variables  predictoras,  como  de  costumbre  esta  dada  por 

j2  =  MSE  =  — SSE  =  46.9 

n  —  k  —  1 
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de  la  tabla  ANOVA.  El  primer  renglon  de  la  figura  13.3  tambien  muestra  s  =  V s2 
=  6.84930  usando  precision  de  computadora.  La  computadora  usa  estos  valores  inter- 
namente  para  producir  estadfsticas  de  prueba,  intervalos  de  confianza  e  intervalos  de 
prediccion,  que  estudiaremos  en  secciones  subsiguientes. 

La  ultima  seccion  de  la  figura  13.3  muestra  una  descomposicion  de  SSR  =  15913.0 
en  que  la  contribucion  condicional  de  cada  variable  de  prediccion  dadas  las  variables  ya 
introducidas  en  el  modelo  se  muestra  para  el  orden  de  entrada  que  se  especifique  en  el 
programa  de  regresion.  Para  el  ejemplo  de  bienes  rafces,  el  programa  MINITAB  introdujo 
las  variables  en  este  orden:  pies  cuadrados,  seguido  de  numeros  de  pisos,  recamaras  y 
banos.  Estas  sumas  de  cuadrados  secuenciales  o  condicionales  constituyen  uno  de  los 
k  =  4  grados  de  libertad  de  regresion.  Es  interesante  observar  que  la  variable  de  predic¬ 
cion  X\  por  si  sola  es  14829.3/15913.0  =  .932  o  93.2%  de  la  variacion  total  explicada 
por  el  modelo  de  regresion,  pero,  si  cambia  el  orden  de  entrada,  otra  variable  puede  ser 
la  parte  principal  de  la  suma  de  cuadrados  de  regresion. 


Prueba  de  la  utilidad  del  modelo 
de  regresion 

Recuerde  que  en  el  capitulo  12  probo  ver  si  y  y  x  estaban  linealmente  relacionadas  al 
probar  H0 :  (3  =  0  con  una  prueba  t  o  una  prueba  F  equivalente.  En  regresion  multiple, 
hay  mas  de  una  pendiente  parcial,  que  son  los  coeficientes  de  regresion  parcial.  Las 
pruebas  t  y  F  ya  no  son  equivalentes. 


La  prueba  Fgeneral  (para  la 
significancia  del  modelo)  en 
regresion  multiple  es  de  una 
cola. 


El  analisis  de  varianza  de  la  prueba  F 

La  ecuacion  de  regresion  que  usa  informacion  dada  por  las  variables  predictoras  at, 
x2,  ...,  xk  ies  sustancialmente  mejor  que  la  predictora  simple  y  que  no  se  apoya  en  nin- 
guno  de  los  valores  de  a?  Esta  pregunta  se  contesta  usando  una  prueba  F  general  con  las 
hipotesis: 

H0 '  Pi  =  /32  =  •  •  •  =  f3k  =  0 


contra 

Hd :  Al  menos  una  de  j6i,  /32,  . . .,  j3k  no  es  0 
La  estadfstica  de  prueba  se  encuentra  en  la  tabla  ANOVA  (figura  13.3)  como 


MSR  3978.3 
MSE~  46.9 


84.80 


que  tiene  una distribucion F con  dfi  =  k  =  4y  df2  =  (n  —  k  —  1)  =  10.  Como  el  valor p, 
P  =  .000,  esta  dado  en  la  salida  impresa,  se  puede  declarar  que  la  regresion  es  altamente 
significativa.  Esto  es,  al  menos  una  de  las  variables  predictoras  esta  aportando  informa¬ 
cion  significativa  para  la  prediccion  de  la  variable  de  respuesta  y. 


Las  salidas  impresas 
MINITAB  informan  de  ff2 
como  un  porcentaje  mas  que 
una  proporcion. 


El  coeficiente  de  determinacion,  R 2 

(■  Que'  tan  bien  se  ajusta  el  modelo  de  regresion?  La  salida  impresa  da  una  medida  esta- 
distica  de  la  fuerza  del  modelo  en  el  coeficiente  de  determinacion,  R2;  es  decir,  la 
proporcion  de  la  variacion  total  que  es  explicada  por  la  regresion  de  y  en  a,,  x2,  ...,  xk, 
definida  como 


SSR  15913.0 
SS  Total  ~  16382.2 


.971  o  97.1% 
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CONSEJO 


Ft 2  es  la  multivariada 
equivalente  de  r2,  empleada 
en  regresion  lineal. 


El  coeficiente  de  determinacion  se  denomina  a  veces  multiplo  R2  y  se  encuentra  en  el 
primer  renglon  de  la  figura  13.3,  marcado  “R-Sq”.  En  consecuencia,  para  el  ejemplo  de 
bienes  rafces,  97.1%  de  la  variation  total  ha  sido  explicado  por  el  modelo  de  regresion. 
El  modelo  se  ajusta  muy  bien. 

Puede  ser  util  saber  que  el  valor  del  estadistico  F  esta  relacionado  con  R2  por  la  for¬ 
mula 

p=  R2/k 

(1  -  R2)/(n  -  k  -  1) 

de  manera  que  R 2  es  grande,  F  es  grande  y  viceversa. 


CONSEJO 


Se  puede  demostrar  que 
MSR  = 

MSE 

R2/k 

(1  -  R2)/(n  —  k  —  1) 


CONSEJO 


Pruebe  la  significance  del 
coeficiente  individual  /3,> 
usando  pruebas  f. 


FIGURA  13.4 

Parte  de  la  salida  impresa 
MINITAB  para  el  ejemplo 
13.2 


Interpretation  de  los  resultados 
de  una  regresion  significativa 

Prueba  de  la  significancia  de  los  coeficientes  de  regresion  parcial 

Una  vez  que  hayamos  determinado  que  el  modelo  es  util  para  predecir  y,  debemos  explo- 
rar  la  naturaleza  de  la  “utilidad”  en  mas  detalle.  ^Todas  las  variables  predictoras  agregan 
informacion  importante  para  la  prediccion  en  presencia  de  otras  variables  predictoras 
que  ya  estan  en  el  modelo?  Las  pruebas  t  individuals  de  la  primera  section  de  la  salida 
impresa  de  regresion  estan  disenadas  para  probar  las  hipotesis 

H0 :  /3,  =  0  contra  //a :  /3,  =£  0 

para  cada  uno  de  los  coeficientes  de  regresion,  dado  que  las  otras  variables  predictoras 
ya  estan  en  el  modelo.  Estas  pruebas  estan  basadas  en  la  estadistica  t  de  Student  dada 
por 

=  b,  -  A 
f  SE  (bd 

que  tiene  df  =  (n  —  k  —  1)  grados  de  libertad.  El  procedimiento  es  identico  al  emplea- 
do  para  probar  una  hipotesis  acerca  de  la  pendiente  (3  del  modelo  de  regresion  lineal 
simple.' 

La  figura  13.4  muestra  las  pruebas  t  y  los  valores  p  de  la  parte  superior  de  la  salida 
impresa  MINITAB.  Al  examinar  los  valores  p  de  la  ultima  columna,  se  puede  ver  que 
todas  las  variables  excepto  x3,  el  numero  de  recamaras,  agregan  suficiente  informacion 
para  predecir  y,  aun  con  todas  las  otras  variables  independientes  del  modelo.  <■  Podria 
ser  mejor  el  modelo?  Pudiera  ser  que  x3  sea  una  variable  de  prediccion  innecesaria.  Una 
option  es  eliminar  esta  variable  y  reajustar  el  modelo  con  un  nuevo  conjunto  de  datos. 


Predictor 
Constant 
Square  Feet 
Number  of  Floors 
Bedrooms 
Baths 


Coef 
118.763 
6.2698 
-16.203 
-2 . 673 
30.271 


SE  Coef 

T 

P 

9.207 

12 . 90 

0 . 000 

0.7252 

8.65 

0 . 000 

6.212 

-2 . 61 

0 . 026 

4 .494 

-0 . 59 

0.565 

6 . 849 

4.42 

0 . 001 

El  valor  de  R 2  ajustado 

Observe  de  la  definition  de  R1  =  SSR/SS  Total  que  su  valor  nunca  puede  disminuir  con 
la  adicion  de  mas  variables  en  el  modelo  de  regresion.  En  consecuencia,  R1  puede  estar 
artificialmente  inflada  por  la  inclusion  de  mas  y  mas  variables  predictoras. 


Algunos  paquetes  usan  el  estadistico  t  que  acabamos  de  describir,  mientras  que  otros  usan  el  estadistico  F  equi¬ 
valente  (F  =  r),  puesto  que  el  cuadrado  de  un  estadistico  t  con  v  grados  de  libertad  es  igual  a  un  estadistico  F 
con  1  df  en  el  numerador  y  v  grados  de  libertad  en  el  denominador. 
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Use  ff^adj)  para  comparar 
uno  o  mas  modelos  posibles. 


Una  medida  alternativa  de  la  fuerza  del  modelo  de  regresion  se  ajusta  para  grados  de 
libertad  con  el  uso  de  cuadraticas  medias  en  lugar  de  sumas  de  cuadrados: 

R\ adj)  =  (l  - _ MSE - -W% 

ira  los  datos  de  b 

tf2(adj)  =  1 1  - 


SS  Total l(n  -  1)/ 

Para  los  datos  de  bienes  rafces  de  la  figura  13.3, 
46.9 


16382.2/14 


100%  =  96.0% 


se  encuentra  en  el  primer  renglon  de  la  salida  impresa.  El  valor  “R-Sq(adj)  =  96.0%” 
representa  el  porcentaje  de  variation  en  la  respuesta  y  explicada  por  las  variables  inde- 
pendientes,  corregida  para  grados  de  libertad.  El  valor  ajustado  de  R2  se  usa  principal- 
mente  para  comparar  dos  o  mas  modelos  de  regresion  que  usan  numeros  diferentes  de 
variables  predictoras  independientes. 


Comprobacion  de  suposiciones  de  regresion 

Antes  de  usar  el  modelo  de  regresion  para  su  proposito  principal,  que  es  estimar  y  prede- 
cir  y,  deben  verse  graficas  residuales  generadas  por  computadora  para  asegurarse  que 
sean  validas  todas  las  suposiciones  de  regresion.  La  grdfica  de  normal  de  probabilidad 
y  la  grdfica  de  residuales  contra  ajuste  se  presentan  en  la  figura  13.5  para  los  datos 
de  bienes  rafces.  Parece  haber  tres  observaciones  que  no  se  ajustan  al  patron  general. 
Se  pueden  ver  como  resultados  atfpicos  en  ambas  graficas.  Es  probable  que  estas  tres 
observaciones  deban  investigarse,  pero  no  dan  fuerte  evidencia  de  que  las  suposiciones 
se  han  violado. 


FIGURA  13.5 

Graficas  de  diagnostico 
MINITAB 


Residuales  contra  los  valorcs  a justados 

(la  respuesta  es  el  precio  de  lista) 


225  250 

Valor  ajustado 


Grafica  de  probabilidad  normal  de  los  residuales 

(la  respuesta  es  el  precio  de  lista) 
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CONSEJO 


Para  valores  dados  de  xh 
x2, xh  el  intervalo  de 
prediccion  siempre  sera  mas 
ancho  que  el  intervalo  de 
confianza. 


Uso  del  modelo  de  regresion  para  estimacion 
y  prediccion 

Finalmente,  una  vez  que  se  haya  determinado  que  el  modelo  es  efectivo  para  describir 
la  relacion  entre  y  y  las  variables  predictoras  xu  x2,  xk,  el  modelo  se  puede  usar  para 
estos  fines: 

•  Estimar  el  valor  promedio  de  y,  E(y),  para  valores  dados  de  x,,  x2,  xk 

•  Predecir  un  valor  particular  de  y  para  valores  dados  de  xu  x2,  ...,xk 


Los  valores  de  xx,  x2,  ...,  xt  se  introducen  en  la  computadora  y  esta  genera  el  valor 
ajustado  y  junto  con  su  error  estandar  estimado  y  los  intervalos  de  confianza  y  predic¬ 
cion.  Recuerde  que  el  intervalo  de  prediccion  es  siempre  mas  ancho  que  el  intervalo  de 
confianza. 

Veamos  que  tan  bien  funciona  nuestra  prediccion  para  los  datos  de  bienes  rafces, 
usando  otra  casa  de  la  base  de  datos  de  la  computadora,  una  casa  con  1000  pies  cuadra- 
dos  de  superficie  de  vivienda,  un  piso,  tres  recamaras  y  dos  banos,  con  precio  de  lista 
de  $221  500.  La  salida  impresa  de  la  figura  13.6  muestra  los  intervalos  de  confianza  y 
prediccion  para  estos  valores.  El  valor  real  cae  dentro  de  dos  intervalos,  lo  que  indica 
que  el  modelo  esta  funcionando  muy  bien. 


FIGURA  13.6 

Intervalos  de  confianza  y 
prediccion  para  el  ejemplo 
13.2 


Predicted  Values  for  New  Observations 

New  Obs  Fit  SE  Fit  95%  Cl  95%  PI 

1  217.78  3.11  (210.86,  224.70)  (201.02,  234.54) 

Values  of  Predictors  for  New  Observations 
New  Square  Number  of 

Obs  Feet  Floors  Bedrooms  Baths 

1  10.0  1.00  3.00  2.00 


UN  MODELO  DE  REGRESION 
POLINOMIAL 

En  la  seccion  13.3  explicamos  en  detalle  las  diversas  partes  de  la  salida  impresa  de 
regresion  multiple.  Cuando  se  efectua  un  analisis  de  regresion  multiple,  se  debe  usar  un 
metodo  de  paso  a  paso: 


1 .  Obtener  el  modelo  de  prediccion  ajustada. 

2.  Usar  el  analisis  de  varianza  de  la  prueba  F  y  R2  para  determinar  que  tan  bien  se 
ajusta  el  modelo  a  los  datos. 

3.  Verificar  las  pruebas  t  para  los  coeficientes  de  regresion  parcial  para  ver  cuales 
estan  aportando  information  significativa  en  presencia  de  los  otros. 

4.  Si  se  escoge  comparar  varios  modelos  diferentes,  use  R2(adj)  para  comparar  su 
efectividad. 

5.  Usar  graficas  residuales  generadas  por  computadora  para  ver  si  hay  violation  de 
las  suposiciones  de  regresion. 


CONSEJO 

Una  ecuacion  cuadratica  es 
y  =  s  +  bx  +  cx1.  La  grafica 
forma  una  parabola. 


Una  vez  tornados  todos  estos  pasos,  estamos  listos  para  usar  el  modelo  para  estimacion 
y  prediccion. 

Las  variables  predictoras  xu  x2,  ...,xk  empleadas  en  el  modelo  lineal  general  no  tienen 
que  representar  variables  predictoras  diferentes.  Por  ejemplo,  si  se  sospecha  que  una 
variable  independiente  x  afecta  la  respuesta  y,  pero  que  la  relacion  es  curvilinea  mas  que 
lineal,  entonces  se  podrfa  escoger  ajustar  a  un  modelo  cuadratico: 

y  =  /30  +  Pi*  +  P2*2  +  e 
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El  modelo  cuadratico  es  un  ejemplo  de  un  modelo  de  segundo  orden  porque  contie- 
ne  un  termino  cuyos  exponentes  suman  2  (en  este  caso,  x2).  Tambien  es  un  ejemplo  de 
un  modelo  polinomial,  un  modelo  que  toma  la  forma 

y  =  a  +  bx  +  cx 2  +  dx  +  •  •  • 

Para  ajustar  este  tipo  de  modelo  usando  el  programa  de  regresion  multiple,  los  valores 
observados  de  y,  x  y  x2  se  introducen  en  la  computadora  y  la  salida  impresa  se  puede 
generar  como  en  la  seccion  13.3. 

En  un  estudio  de  variables  que  afecta  la  productividad  en  el  comercio  de  comestibles  al 
menudeo,  W.S.  Good  usa  valor  agregado  por  hora  de  trabajo  para  medir  la  productividad 
de  tiendas  de  comestibles  al  menudeo.1  El  define  “valor  agregado”  como  “el  excedente 
[dinero  generado  por  el  negocio]  disponible  para  pagar  empleados,  mobiliario  y  ense- 
res,  y  equipo”.  Los  datos  consistentes  con  la  relacion  entre  valor  agregado  por  hora  de 
trabajo  y  y  el  tamano  x  de  una  tienda  de  comestibles  descrita  en  el  artfculo  de  Good,  se 
muestran  en  la  tabla  13.2  para  10  tiendas  de  alimentos  ficticias.  Escoja  un  modelo  para 
relacionar  y  con  x. 


TABLA  13.2  Datos  sobre  tamano  de  tienda  y  valor  agregado 


Tienda  Valor  agregado  por  hora  de  trabajo,  y  Tamano  de  tienda  (miles  de  pies  cuadrados),  x 


1 

$4.08 

21.0 

2 

3.40 

12.0 

3 

3.51 

25.2 

4 

3.09 

10.4 

5 

2.92 

30.9 

6 

1.94 

6.8 

7 

4.11 

19.6 

8 

3. IB 

14.5 

9 

3.75 

25.0 

10 

3.60 

19.1 

Solucion  Se  puede  investigar  la  relacion  entre  y  y  x  a  I  ver  la  grafica  de  los  puntos 
en  la  figura  13.7.  La  grafica  sugiere  que  la  productividad,  y,  aumenta  cuando  el  tama¬ 
no  de  la  tienda  de  comestibles,  x,  aumenta  hasta  alcanzar  un  tamano  optimo.  Arriba  de 
ese  tamano,  la  productividad  tiende  a  disminuir.  La  relacion  parece  ser  curvilinea  y  un 
modelo  cuadratico, 

E(j)  =  Po  +  PiX  +  j B2x2 

FIGURA  13.7 

Grafica  del  tamano  xy 
valor  agregado  ypara  el 
ejemplo  13.3 


1  El  orden  de  un  termino  esta  determinado  por  la  suma  de  los  exponentes  de  variables  que  conforman  ese  termino. 
Los  terminos  que  contienen  X\  o  x2  son  de  primer  orden;  los  que  contienen  x[,  x~2  o  x2x2  son  de  segundo  orden. 
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puede  ser  apropiado.  Recuerde  que,  al  escoger  usar  este  modelo,  no  estamos  diciendo 
que  la  verdadera  relation  sea  cuadratica,  sino  solo  que  puede  dar  estimaciones  y  predic- 
ciones  mas  precisas  que,  por  ejemplo,  un  modelo  lineal. 


Consulte  los  datos  sobre  productividad  de  una  tienda  minorista  de  alimentos  del  ejemplo 
13.3.  Se  utilizo  el  MINITAB  para  ajustar  un  modelo  cuadratico  a  los  datos  y  para  graficar 
la  curva  cuadratica  de  prediction,  junto  con  los  puntos  de  datos  graficados.  Analice  lo 
adecuado  del  modelo  ajustado. 


Solution  De  la  salida  impresa  de  la  figura  13.8,  se  puede  ver  que  la  ecuacion  de 
regresion  es 

y  =  —.159  +  392x  -  .00949x2 


FIGURA  13.8 

Salida  impresa  MINITAB 
para  el  ejemplo  13.4 


CONSEJO 


Vea  la  salida  impresa  y 
encuentre  las  leyendas 
para  "Predictor’'.  Esto  le 
dira  cuales  variables  se  han 
usado  en  el  modelo. 


La  grafica  de  esta  ecuacion  cuadratica  junto  con  los  puntos  de  datos  se  muestra  en  la 
figura  13.9. 


Analisis  de  regresion:  y  contra  x,  x-sq 

The  regression  equation  is 
y  =  -  0.159  +  0.392  x  -  0.00949  x-sq 


Predictor 

Constant 

x 

x-sq 


Coef 
-0 . 1594 
0.39193 
-0 . 009495 


St  Coef 
0.5006 
0 . 05801 
0 . 001535 


T 

-0.32 
6 . 76 
-6.19 


P 

0 . 760 
0 . 000 
0 . 000 


S  =  0.250298  R-Sq  =  87.9% 


R-Sq(adj)  =  84.5% 


Analysis  of  Variance 

Source  DF  SS  MS 
Regression  2  3.1989  1.5994 
Residual  Error  7  0.4385  0.0626 
Total  9  3.6374 


F 

25 . 53 


P 

0 . 001 


Source  DF 

x  1 

x-sq  1 


Seq  SS 
0 . 8003 
2 .3986 


Para  evaluar  lo  adecuado  del  modelo  cuadratico,  la  prueba  de 
Ho  '■  /3i  =  ft  =  0 


contra 

Ha :  Ni  ySi  ni  (32  son  0 
se  da  en  la  salida  impresa  como 


MSR 

MSE 


25.53 


www.FreeLibros.me 


562  O  CAPiTULO  13  anAlisis  de  regresion  multiple 


con  valor  p  =  .001.  En  consecuencia,  el  ajuste  total  del  modelo  es  altamente  significa¬ 
tive.  La  regresion  cuadratica  es  R 2  =  87.9%  de  la  variacion  en  y  [i?2(adj)  =  84.5%]. 

De  las  pruebas  t  para  las  variables  individuales  del  modelo,  se  puede  ver  que  b,  y  b2 
son  altamente  significativas,  con  valores  p  iguales  a  .000.  Observe  de  la  seccion  de  suma 
secuencial  de  cuadrados  que  la  suma  de  cuadrados  para  regresion  lineal  es  .8003,  con 
una  suma  de  cuadrados  adicional  de  2.3986  cuando  se  agregue  el  termino  cuadrado. 
Es  evidente  que  el  modelo  de  regresion  lineal  simple  es  inadecuado  para  describir  los 
datos. 

Una  ultima  mirada  a  las  graficas  residuales  generadas  por  MINITAB  en  la  figura  13.10 
asegura  que  las  suposiciones  de  regresion  sean  validas.  Observe  el  aspecto  relativamente 
lineal  de  la  grafica  normal  y  la  relativa  dispersion  de  los  residuales  contra  los  ajustes.  El 
modelo  cuadratico  da  predicciones  precisas  para  valores  de  x  que  se  encuentren  dentro 
del  rango  de  los  valores  muestreados  de  x. 


EJERCICIOS 


© 

TECNICAS  BASICAS 


13.1  Suponga  que  E(y)  esta  relacionada  a  dos  variables 
predictoras,  Xi  y  x2,  por  la  ecuacion 

Ely)  =  3  +  x,  —  2x2 

a.  Grafique  la  relacion  entre  E(y)  y  x,  cuando  x2  =  2. 
Repita  para  x2  =  1  y  para  x2  =  0. 


b.  (',Que  relacion  tienen  entre  si  las  rectas  del 
inciso  a)? 

13.2  Consulte  el  ejercicio  13.1. 
a.  Grafique  la  relacion  entre  E(y)  y  x2  cuando  x,  =  0. 
Repita  para*!  =  1  parax[  =  2. 
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b.  7,  Que  relation  tienen  entre  si  las  lfneas  del  inciso  a)? 

c.  Suponga,  en  una  situation  practica,  que  se  desea 
modelar  la  relacion  entre  E(y )  y  dos  variables 
predictoras  xx  y  x2.  yC'ual  es  la  implication  de 
usar  el  modelo  de  primer  orden  E(y)  =  /30  +  /Lx, 

+  (3  2x2l 

13.3  Suponga  que  se  ajusta  el  modelo 

E(y )  =  j80  +  (3^1  +  (52x2  +  fiiXi 

a  15  puntos  de  datos  y  se  encuentra  que  F  es  igual  a 
57.44. 

a.  ^Los  datos  dan  suficiente  evidencia  para  indicar 
que  el  modelo  aporta  information  para  la  prediction 
de  y?  Pruebe  usando  un  nivel  de  significance  de  5%. 

b.  Use  el  valor  de  F  para  calcular  R2.  Interprete 
su  valor. 

13.4  La  salida  impresa  de  computadora  para  el  analisis 
de  regresion  multiple  para  el  ejercicio  13.3  da  esta 
information: 

b0  =  1.04  bi  =  1.29 

SEC^)  =  .42 
b2  =  2.72  b3  =  .41 

SE(b2 )  =  .65  SE  (b3)  =  .17 

a.  /Cual,  si  hay  alguna,  de  las  variables  independientes 
xu  x2  y  x3  aportan  information  para  la  prediction 
dey? 

b.  De  la  ecuacion  de  prediccion  de  mmirnos  cuadrados. 

c.  En  la  misma  hoja  de  papel,  grafique  y  contra  x, 
cuando  x2=  1  y  x3  =  0  y  cuando  x2=  1  y  x3  =  .5. 
iQue  relation  tienen  entre  si  las  dos  rectas? 

d.  ('Cual  es  la  interpretation  practica  del  parametro  /3i? 

13.5  Suponga  que  se  ajusta  el  modelo 

E(y )  =  p0  +  /Lx  +  p2x2 

a  20  puntos  de  datos  y  se  obtiene  la  salida  impresa 
MINITAB  siguiente: 

Salida  impresa  MINITAB  para  el  ejercicio  13.5 

Analisis  de  regresion:  y  contra  x,  x-sq 

The  regression  equation  is 


y  =  10.6  + 

4.44  x  -  0 . 

648  x-sq 

Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

10 . 5638 

0.6951 

15.20 

0 . 000 

X 

4.4366 

0 . 5150 

8 . 61 

0 . 000 

x-sq 

-0 . 64754 

0 . 07988 

-8 . 11 

0 . 000 

S  =  1.191 

R-Sq  =  81 

.5%  R-, 

Sq(adj)  = 

79.3% 

Analysis  of 

Variance 

Source 

DF 

SS 

MS 

F 

Regression 

2 

106 . 072 

53 . 036 

37.37 

Residual  Error  17 

24 . 128 

1.419 

Total 

19 

130.200 

a.  ^Que  tipo  de  modelo  se  ha  escogido  para  ajustar  los 
datos? 

b.  7,  Que  tan  bien  ajusta  los  datos  el  modelo?  Explique. 

c.  pLos  datos  dan  suficiente  evidencia  para  indicar  que 
el  modelo  aporta  information  para  la  prediccion  de  y? 
Use  el  metodo  del  valor  p. 

13.6  Consulte  el  ejercicio  13.5. 

a.  ^Cual  es  la  ecuacion  de  prediccion? 

b.  Grafique  la  ecuacion  de  prediccion  sobre  el  intervalo 
0  <  x  <  6. 

13.7  Consulte  el  ejercicio  13.5. 

a.  (iCual  es  su  estimation  del  valor  promedio  de  y 
cuando  x  =  0? 

b.  (:,Los  datos  dan  suficiente  evidencia  para  indicar  que  el 
valor  promedio  de  y  difiere  de  0  cuando  x  =  0? 

13.8  Consulte  el  ejercicio  13.5. 

a.  Suponga  que  la  relacion  entre  E(y)  y  x  es  una  recta. 

7,  Que  se  sabrfa  acerca  del  valor  de  (3T! 

b.  yLos  datos  dan  suficiente  evidencia  para  indicar 
curvatura  en  la  relacion  entre  y  y  x? 

13.9  Consulte  el  ejercicio  13.5.  Suponga  que  y  es  la 
utilidad  para  algun  negocio  y  x  es  la  cantidad  de  capital 
invertido,  y  se  sabe  que  la  tasa  de  aumento  en  utilidad 
para  un  aumento  unitario  en  capital  invertido  solo  puede 
disminuir  cuando  x  aumenta.  Se  desea  saber  si  los  datos 
dan  suficiente  evidencia  para  indicar  una  tasa  decrecien- 
te  de  aumento  en  utilidad  cuando  la  cantidad  de  capital 
invertido  aumenta. 

a.  Las  circunstancias  descritas  implican  una  prueba 
estadfstica  de  una  cola?  Por  que? 

b.  Realice  la  prueba  al  nivel  de  significancia  de  1%. 
Exprese  sus  conclusiones. 

APLICACIONES 

(^)datos  13.10  Libros  de  texto  universitarios  Un 

editor  de  libros  de  texto  universitarios  realizo 
un  estudio  para  relacionar  la  utilidad  por  texto  y,  con  el 
costo  de  ventas  x,  en  un  periodo  de  6  anos  cuando  su 
fuerza  de  ventas  (y  costos  de  ventas)  estaban  creciendo 
rapidamente.  Se  recolectaron  estos  datos  de  inflation 
ajustada  (en  miles  de  dolares): 


Utilidad  por  texto,  y 

16.5 

22.4 

24.9 

28.8 

31.5 

35.8 

Costo  de  ventas 
por  texto,  x 

5.0 

5.6 

6.1 

6.8 

7.4 

8.6 

Esperando  que  la  utilidad  por  libro  subiera  y  luego  se 
nivelara,  el  editor  ajusto  el  modelo  E(y)  =  [3n  +  [3,x  + 
/Lx2  a  los  datos. 
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Salida  impresa  MINITABpara  el  ejercicio  13.10 

Analisis  de  regresion:  y  contra  x,  s-sq 

The  regression  equation  is 
y  =  -  44.2  +  16.3  x  -  0.820  x-sq 


Predictor 

Coef 

SE 

Coef 

T 

P 

Constant 

-44 . 192 

8 

.287 

-5.33 

0 . 013 

X 

16.334 

2 

.490 

6.56 

0 . 007 

x-sq 

-0 . 8198 

0  . 

1824 

-4.49 

0 . 021 

S  =  0.594379 

R-Sq 

=  99.6% 

R- 

Sq(adj)  = 

99.3% 

Analysis  of 

Variance 

Source 

DF 

SS 

MS 

F 

P 

Regression 

2 

234 . 96 

117.48 

332.53 

0 .000 

Residual  Error  3 

1 . 06 

0.35 

Total 

5 

236 . 02 

Source 

DF 

Seq  SS 

X 

1 

227 . 82 

x-sq 

1 

7 . 14 

a.  Grafique  los  puntos  de  datos.  (;Le  parece  que  el 
modelo  cuadratico  es  necesario? 

b.  Encuentre  s  en  la  salida  impresa.  Confirme  que 


c.  pLos  datos  dan  suficiente  evidencia  para  indicar  que 
el  modelo  contribuye  con  informacion  para  la 
prediccion  de  y?  ^Cual  es  el  valor  p  para  esta  prueba 
y  que  significa? 

d.  ('Cuanto  de  la  suma  de  cuadrados  de  regresion  es 
tornado  en  cuenta  por  el  termino  cuadratico? 

7,  El  termino  lineal? 

e.  7,  Que  signo  se  esperarfa  que  tenga  el  valor  real  de  (3T! 
Encuentre  el  valor  de  (32  en  la  salida  impresa.  ^Este 
valor  confirma  las  expectativas? 

f.  7  Los  datos  indican  una  curvatura  significativa  en  la 
relacion  entre  yyxl  Pruebe  al  nivel  de  significancia 
de  5%. 

g.  7  Que  conclusiones  se  pueden  sacar  de  las  graficas 
residuales  siguientes? 


Graficas  MINITAB  para  el  ejercicio  13.10 


Valores  residuales  contra  ajustados 

(la  respuesta  es  y) 

1.00- - 

0.75- 

0.50- 

3 

1  025  “ 

at 

0.00 - j - 

-0.25- 

-0.50-  • 


13.1 1  Libros  de  texto  universitarios  II  Consulte  el 
ejercicio  13.10. 

a.  Use  los  valores  de  la  SSR  y  SS  Total  para  calcular 
R2.  Compare  este  valor  con  el  valor  dado  en  la  salida 
impresa. 

b.  Calcule  /C(adj).  ,'Cuando  serfa  apropiado  usar 
este  valor  en  lugar  de  R2  para  evaluar  el  ajuste  del 
modelo? 

c.  El  valor  de  /?2(adj)  fue  de  95.7%  cuando  un  modelo 
lineal  simple  se  ajusto  a  los  datos.  7  El  modelo  lineal 
o  el  cuadratico  ajustan  mejor? 

(^)datos  13.12  Hamburguesas  de  verduras  Una 

persona  tiene  una  parrilla  caliente  y  un 
panecillo  de  hamburguesa  vacfo,  pero  ha  jurado  dejar  las 
hamburguesas  grasientas.  ^Es  buena  una  hamburguesa 
sin  carne?  Los  datos  de  la  tabla  siguiente  dan  puntuacion 
de  sabor  y  textura  (entre  0  y  100)  para  12  marcas  de 
hamburguesas  sin  carne  junto  con  el  precio,  numero  de 
calorfas,  cantidad  de  grasa  y  una  cantidad  de  sodio  por 
hamburguesa.2  Algunas  de  estas  marcas  tratan  de  imitar 
el  sabor  de  la  carne,  no  asf  otras.  La  salida  impresa 
MINITAB  muestra  la  regresion  de  la  puntuacion  de  sabor  y 
en  las  cuatro  variables  predictoras:  precio,  calorfas,  grasa 
y  sodio. 


Marca 

Puntos,  y 

Precio,  x 

Caiorias,  x2 

Grasa,  x3 

Sodio, 

1 

70 

91 

110 

4 

310 

2 

45 

68 

90 

0 

420 

3 

43 

92 

80 

1 

280 

4 

41 

75 

120 

5 

370 

5 

39 

88 

90 

0 

410 

6 

30 

67 

140 

4 

440 

7 

68 

73 

120 

4 

430 

8 

56 

92 

170 

6 

520 

9 

40 

71 

130 

4 

180 

10 

34 

67 

110 

2 

180 

11 

30 

92 

100 

1 

330 

12 

26 

95 

130 

2 

340 
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Salida  impresa  MINITAB para  el  ejercicio  13.12 
Analisis  de  regresion:  y  contra  xl,  x2,  x3,  x4 
The  regression  equation  is 


y  =  59.8  + 

0.129  xl  - 

0.580  x2  +  8.50  x3  +  0.0488  x4 

Predictor 

Coef 

SE  Coef 

T  P 

Constant 

59.85 

35 . 68 

1.68  0.137 

xl 

0 . 1287 

0.3391 

0.38  0.716 

x2 

-0.5805 

0.2888 

2.01  0.084 

x3 

8.498 

3.472 

2.45  0.044 

x4 

0 . 04876 

0 . 04062 

1.20  0.269 

S  =  12.7199 

R-Sq  = 

49.9%  R-Sq(adj) 

=  21.3% 

Analysis  of 

Variance 

Source 

DF 

SS  MS 

F  P 

Regression 

4 

1128.4  282.1 

1.74  0.244 

Residual  Error  7 

1132.6  161.8 

Total 

11 

2261.0 

Source 

DF 

Seq  SS 

xl 

1 

11.2 

x2 

1 

19 . 6 

x3 

1 

864 . 5 

x4 

1 

233.2 

a.  Comente  sobre  el  ajuste  del  modelo  usando  el 
estadfstico  de  la  prueba  para  el  ajuste  general  y 
el  coeficiente  de  determinacion,  R2. 

b.  Si  desea  reajustar  el  modelo  al  eliminar  una  de  las 
variables  independientes,  ('  cual  eliminana?  ^Por  que? 

13.13  Hamburguesas  de  verduras  II  Consulte  el 
ejercicio  13.12.  Un  comando  en  el  menu  MINITAB  de 
regresion  da  la  salida  impresa  en  la  que  R 2  y  /?2(adj)  se 
calculan  para  todos  los  posibles  subconjuntos  de  las 
cuatro  variables  independientes.  La  salida  impresa  es  la 
siguiente. 

Salida  impresa  MINITABpara  el  ejercicio  13.13 


Mejor  regresion  de  conjuntos:  y  contra  xl,  x2,  x3,  x4 

Response  is  y 


R-Sq 

Mallows 

X 

X 

X 

X 

Vars 

R-Sq 

(adj  ) 

C-p 

s 

1 

2 

3 

4 

1 

17.0 

8 . 7 

3.6 

13.697 

X 

1 

6.9 

0.0 

5 . 0 

14.506 

X 

2 

37.2 

23.3 

2 . 8 

12.556 

X 

X 

2 

20.3 

2.5 

5.1 

14 . 153 

X 

X 

3 

48 . 9 

29 . 7 

3.1 

12 . 020 

X 

X 

X 

3 

39.6 

16 . 9 

4.4 

13 . 066 

X 

X 

X 

4 

49.9 

21.3 

5 . 0 

12.720 

X 

X 

X 

X 

a.  Si  tuviera  que  comparar  estos  modelos  y  escoger  el 
mejor,  (:,cual  modelo  escogerfa?  Explique. 

b.  Comente  sobre  la  utilidad  del  modelo  que  escogio 
en  el  inciso  a).  <\Su  modelo  es  valioso  para  predecir 
una  calificacion  del  gusto  basada  en  las  variables 
predictoras  escogidas? 

(^)datos  13.14  Contaminacion  del  aire  III  Un 

experimento  esta  disenado  para  comparar  varios 
tipos  diferentes  de  monitores  de  contaminacion  del  aire.3 
Cada  monitor  se  instalo  y  luego  se  le  expuso  a  diferentes 
concentraciones  de  ozono,  de  entre  15  y  230  partes 
por  millon  (ppm),  durante  periodos  de  8  a  72  horas. 

A  continuation  se  analizaron  los  filtros  del  monitor  y 


se  midio  la  respuesta  del  monitor.  Los  resultados  para 
un  tipo  de  monitor  mostraron  un  patron  lineal  (vease  el 
ejercicio  12.14).  Los  resultados  para  otro  tipo  de  monitor 
se  dan  en  la  tabla  siguiente. 

Ozono 

(ppm/h),  x _ .06  .12  .18  .31  .57  .65  .68  1.29 

Densidad 
relativa  de 

fluorescencia,  y  8  18  27  33  42  47  52  61 

a.  Grafique  los  datos.  7,  Que  modelo  se  esperarfa  que 
diera  el  mejor  ajuste  a  los  datos?  Escriba  la  ecuacion 
de  ese  modelo. 

b.  Use  un  paquete  de  software  de  computadora  para 
ajustar  el  modelo  del  inciso  a). 

c.  Encuentre  la  recta  de  regresion  de  mmimos 
cuadrados  que  relacione  la  respuesta  del  monitor 
a  la  concentration  de  ozono. 

d.  7,  El  modelo  aporta  informacion  significativa  para 
la  prediccion  de  la  respuesta  del  monitor  basada  en 
exposition  al  ozono?  Use  el  valor  p  apropiado  para 
tomar  una  decision. 

e.  Encuentre  R2  en  la  salida  impresa.  i Que  dice  este 
valor  acerca  de  la  efectividad  del  analisis  de  regresion 
multiple? 

^)datos  13.15  Utilidades  corporativas  Para 

estudiar  la  relation  de  publicidad  e  inversion  de 
capital  con  utilidades  corporativas,  los  datos  siguientes, 
registrados  en  unidades  de  $100000,  se  recolectaron 
para  10  empresas  de  mediano  tamano  en  el  mismo  ano. 

La  variable  y  representa  utilidad  para  el  ano,  X\  representa 
inversion  de  capital  y  x2  representa  gasto  en  publicidad. 


y 

X, 

Xl 

/ 

x, 

Xl 

15 

25 

4 

1 

20 

0 

16 

1 

5 

16 

12 

4 

2 

6 

3 

18 

15 

5 

3 

30 

1 

13 

6 

4 

12 

29 

2 

2 

16 

2 

a.  Usando  el  modelo 

y  =  Po  +  /3|X  +  (32x2 

y  un  paquete  apropiado  de  software,  encuentre  la 
ecuacion  de  prediccion  de  mmimos  cuadrados  para 
estos  datos. 

b.  Use  la  prueba  F  general  para  determinar  si  el  modelo 
aporta  informacion  significativa  para  la  prediccion  de 
y.  Use  a  =  .01. 

c.  El  gasto  en  publicidad  x2  aporta  informacion 
significativa  para  la  prediccion  de  y,  dado  que  x,  ya 
esta  en  el  modelo?  Use  a  =  .01. 

d.  Calcule  el  coeficiente  de  determinacion,  R2. 7, Que 
porcentaje  de  la  variation  general  esta  explicado  por 
el  modelo? 
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oatos  13.16  YouTube  El  sitio  YouTube  de  videos 
compartidos  atrajo  19.6  millones  de  visitantes 
en  junio  de  2006,  un  aumento  de  casi  300%  desde  enero 
de  ese  mismo  ano.  A  pesar  del  fenomenal  crecimiento  de 
YouTube,  algunos  analistas  cuestionaron  si  el  sitio 
puede  hacer  una  transicion  de  un  servicio  gratuito  a  uno 
que  pueda  hacer  dinero.  La  tendencia  de  crecimiento  para 
YouTube  de  agosto  de  2005  a  junio  de  2006  se  da  en  la 
tabla  siguiente.4 


Tiempo 

Tiempo  codificado 

Total  de  visitantes  unicos 
(000) 

8/2005 

1 

72 

9/2005 

2 

100 

10/2005 

3 

750 

11/2005 

4 

990 

12/2005 

5 

1600 

1/2006 

6 

2800 

2/2006 

7 

4100 

3/2006 

8 

5700 

4/2006 

9 

6600 

5/2006 

10 

12  600 

6/2006 

11 

12  800 

a.  Con  base  en  las  estadisticas  de  resumen  de  las  graficas 
de  lineas,  ^cual  de  los  dos  modelos  ajusta  mejor  los 
datos? 

b.  Escriba  la  ecuacion  para  el  modelo  cuadratico. 

c.  Use  la  siguiente  salida  impresa  para  determinar  si  el 
termino  cuadratico  aporta  information  significativa  a 
la  prediction  de  y,  en  presencia  del  termino  lineal. 


Las  graficas  ajustadas  lineal  y  cuadratica  para  estos  datos 


Analisis  de  regresion:  numero  contra  tiempo,  tiempo-sq 


son  como  sigue: 


Grafica  de  recta  ajustada 

y  =  -3432  +  1301  x 


The  regression  equation  is 

Number  =  886  -  692  Time  +  166  Time-sq 


Predictor  Coef  SE  Coef 
Constant  886  1037 
Time  -691.9  397.2 
Time-sq  166.07  32.24 


T  P 

0.85  0.418 

-1.74  0.120 

5.15  0.001 


S  =  944.381  R-Sq  =  96.7% 


R-Sq(adj)  =  95.9% 


Analysis  of  Variance 


Source  DF 
Regression  2 
Residual  Error  8 
Total  10 


SS 

209848944 

7134840 

216983783 


MS 

104924472 

891855 


F  P 

117.65  0.000 


USO  DE  VARIABLES  PREDICTORAS 
CUANTITATIVAS  Y  CUALITATIVAS 
EN  UN  MODELO  DE  REGRESION 

Una  razon  por  la  que  los  modelos  de  regresion  multiple  son  muy  flexibles  es  que  toman 
en  cuenta  el  uso  de  variables  predictoras  cualitativas  y  cuantitativas.  Para  los  metodos 
de  regresion  multiple  que  se  usan  en  este  capitulo,  la  variable  de  respuesta  y  debe  ser 
cuantitativa,  midiendo  una  variable  aleatoria  numerica  que  tiene  una  distribution  nor¬ 
mal  (de  acuerdo  con  las  suposiciones  de  la  section  13.2).  No  obstante,  cada  variable 
independiente  predictora  puede  ser  cuantitativa  o  cualitativa,  cuyos  niveles  representan 
cualidades  o  caracterfsticas  y  solo  pueden  ser  categorizados. 
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CONSEJO 

Introduzca  variables 

cuantitativas  como 
•  una  sola  x 


•  una  potencia  de  orden 
superior,  /  o/ 

•  una  interaction  con  otra 
variable. 


Las  variables  cuantitativas  y  cualitativas  introducen  el  modelo  de  regresion  en  formas 
diferentes.  Para  complicar  las  cosas,  podemos  permitir  una  combination  de  tipos  dife- 
rentes  de  variables  en  el  modelo  y  podemos  permitir  que  las  variables  interactuen,  un 
concepto  que  puede  serle  familiar  a  usted  en  el  experimento  factorial  del  capitulo  1 1 . 
Consideremos  estas  opciones  una  por  una. 

Una  variable  cuantitativa  x  puede  introducirse  como  termino  lineal,  x  o  elevado  a 
alguna  potencia  de  grado  superior  como  x2  o  ,r\  como  en  el  modelo  cuadratico  del  ejem- 
plo  13.3.  Cuando  sea  necesaria  mas  de  una  variable  cuantitativa,  la  interpretation  de  los 
posibles  modelos  se  hace  mas  complicada.  Por  ejemplo,  con  dos  variables  cuantitativas 
xl  y  x2,  se  puede  usar  un  modelo  de  primer  orden  como  lo  es 

E(y)  =  Po  +  P&\  +  p2x2 

que  traza  un  piano  en  espacio  tridimensional  (vease  la  figura  13.1).  No  obstante,  puede 
ser  que  una  de  las  variables,  por  ejemplo  x2,  no  este  relacionada  con  y  en  la  misma  forma 
cuando  jq  =  1  con  lo  esta  cuando  x,  =  2.  Para  permitir  que  x2  se  comporte  de  manera 
diferente  dependiendo  del  valor  de  xu  sumamos  un  termino  de  interaccion,  x,x2,  y 
permitimos  que  el  piano  bidimensional  se  tuerza.  El  modelo  es  ahora  un  modelo  de 
segundo  orden: 

E(y)  =  p0  +  PiXi  +  p2x2  +  /33x,x2 

Los  modelos  se  hacen  complicados  mas  rapidamente  cuando  se  permite  que  relaciones 
curvilmeas  e  interaccion  para  las  dos  variables.  Una  forma  de  determinar  sobre  el  tipo 
de  modelo  que  se  necesita  es  graficar  algunos  de  los  datos,  quiza  y  contra  xlt  y  contra  x2, 
y  y  contra  x2  para  varios  valores  de  x\. 

En  contraste  con  variables  predictoras  cuantitativas,  las  variables  predictoras  cuali¬ 
tativas  se  introducen  en  un  modelo  de  regresion  a  traves  de  variables  ficticias  o  in- 
dicadoras.  Por  ejemplo,  en  un  modelo  que  relatione  el  salario  medio  de  un  grupo  de 
empleados  con  varias  variables  predictoras,  se  puede  incluir  el  antecedente  etnico  del  em- 
pleado.  Si  cada  empleado  incluido  en  su  estudio  pertenece  a  uno  de  tres  grupos  etnicos, 
A,  B  o  C,  se  puede  introducir  la  variable  cualitativa  “etnia”  en  su  modelo  usando  dos 
variables  ficticias: 

_  J  1  si  grupo  B  _  [  1  si  grupo  C 

Xl  [  0  si  no  Xl  1  0  si  no 


CONSEJO 

Las  variables  cualitativas  se 
introducen  como  variables 
ficticias,  una  menos  que 
el  numero  de  categorias  o 
niveles. 


Vea  el  efecto  que  estas  dos  variables  tienen  en  el  modelo  E(y)  =  [3,,  +  ptxt  +  p2x2:  para 
empleados  del  grupo  A, 

E{y)  =  p0  +  pm  +  pm  =  Po 
para  empleados  del  grupo  B, 

E{y)  =  p0  +  pm  +  pm  =  Po  +  Pi 

y  para  los  del  grupo  C, 

E(y)  =  p0  +  pm  +  pm  =  p0  +  p2 

El  modelo  permite  una  respuesta  promedio  diferente  para  cada  grupo.  Pi  mide  la  dife- 
rencia  en  las  respuestas  promedio  entre  los  grupos  B  y  A,  en  tanto  que  p2  mide  la  di- 
ferencia  entre  los  grupos  C  y  A. 

Cuando  una  variable  cualitativa  contiene  k  categorias  o  niveles,  {k  —  1 )  variables  ficti¬ 
cias  deben  agregarse  al  modelo  de  regresion.  Este  modelo  puede  contener  otras  variables 
predictoras,  cuantitativas  o  cualitativas,  asf  como  productos  cruzados  (interacciones)  de 
las  variables  ficticias  con  otras  variables  que  aparecen  en  el  modelo.  Como  se  puede  ver, 
el  proceso  de  construir  un  modelo,  es  decir,  decidir  sobre  los  terminos  apropiados  a 
introducir  en  el  modelo  de  regresion,  puede  ser  bastante  complicado.  No  obstante,  usted 
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puede  tener  mas  habilidad  para  construir  un  modelo,  adquiriendo  experiencia  con  los 
ejercicios  del  capitulo.  El  ejemplo  siguiente  contiene  una  variable  cuantitativa  y  una 
cualitativa  que  interactuan. 

Se  realizo  un  estudio  para  examinar  la  relacion  entre  salario  en  una  universidad,  y,  el 
numero  de  anos  de  experiencia  del  miembro  del  profesorado  y  el  genero  del  miembro 
del  profesorado.  Si  se  espera  que  haya  una  relacion  de  linea  recta  entre  salario  medio  y 
anos  de  experiencia  para  Caballeros  y  mujeres,  escriba  el  modelo  que  relacione  salario  me¬ 
dio  con  las  dos  variables  predictoras:  anos  de  experiencia  (cuantitativa)  y  genero  del 
profesor  (cualitativa). 


Solucion  Dado  que  se  puede  sospechar  que  las  rectas  de  salario  medio  para  Caballe¬ 
ros  y  mujeres  son  diferentes,  su  modelo  para  el  salario  medio  E(y)  puede  aparecer  como 
se  muestra  en  la  figura  13.11.  Una  relacion  de  linea  recta  entre  E(y)  y  anos  de  experien¬ 
cia  x j  implica  el  modelo 


E(y)  =  /30  + 


FIGURA  13.11 

Relacion  hipotetica  para 
salario  medio  E(y),  anos  de 
experiencia  (x,),  y  genero 
(x2)  para  el  ejemplo  13.5 


Anos  de 
experiencia 


La  variable  cualitativa  “genero”  contiene  k  =  2  categories,  Caballeros  y  mujeres.  Por  lo 
tanto,  se  necesita  (k  —  1)  =  1  variable  ficticia,  x2,  definida  como 

1  si  es  hombre 
A'2  1  0  si  es  mujer 

y  el  modelo  se  expande  para  convertirse  en 
E(y)  =  /3o  +  jSjXi  +  (32x2 

El  hecho  de  que  las  pendientes  de  las  dos  rectas  puedan  diferir  significa  que  las  dos 
variables  predictoras  interactuan;  esto  es,  el  cambio  en  E(y)  correspondiente  a  un  cam- 
bio  en  Xi  depende  de  si  el  profesor  es  hombre  o  mujer.  Para  tomar  en  cuenta  esta  interac¬ 
cion  (diferencia  en  pendientes),  el  termino  de  interaccion  xhx2  se  introduce  en  el  modelo. 
El  modelo  completo  que  caracteriza  la  grafica  de  la  figura  13.11  es 

variable  ficticia 
para  genero 

I 

E(y )  =  jS0  +  PiXi  +  p2x2  +  /3 ixix2 

T  T 

anos  de  interaccion 

experiencia 
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donde 


Xi  =  Anos  de  experiencia 


[  1  si  es  hombre 
[  0  si  es  mujer 


Se  puede  ver  como  funciona  el  modelo  al  asignar  valores  a  la  variable  ficticia  x2.  Cuando 
la  profesora  es  mujer,  el  modelo  es 


E(y)  —  ft  +  ftxi  +  /32(0)  +  ftx^O)  -  ft  +  ftx! 


que  es  una  recta  con  pendiente  ft  y  punto  de  cruce  ft.  Cuando  el  profesor  es  hombre, 
el  modelo  es 


E(y)  —  ft  +  /8iXi  +  ft(l)  +  ftxi(l)  -  (ft  +  ft)  +  (ft  +  ftft 


que  es  una  recta  con  pendiente  (ft  +  yS3)  e  intersection  (ft  +  ft).  Las  dos  rectas  tie- 
nen  pendientes  diferentes  e  intersecciones  diferentes,  lo  cual  permite  la  relation  entre 
salario  y  y  anos  de  experiencia  xt  a  comportarse  de  manera  diferente  para  Caballeros  y 
mujeres. 


Se  seleccionaron  muestras  aleatorias  de  seis  mujeres  y  seis  Caballeros  profesores  auxilia- 
res,  de  entre  los  profesores  auxiliares  de  una  universidad  de  artes  y  ciencias.  Los  datos 
sobre  el  salario  y  anos  de  experiencia  se  muestran  en  la  tabla  13.3.  Observe  que  cada  una 
de  las  dos  muestras  (hombre  y  mujer)  contenfa  dos  profesores  con  tres  anos  de  experien¬ 
cia,  pero  ninguno  tenia  2  anos  de  experiencia.  Interprete  la  salida  impresa  MINITAB  de 
regresion  y  grabque  las  rectas  de  salario  predeterminadas. 


Salario  contra  genero  y  anos  de  experiencia 


Anos  de  experiencia,  x , 

Salario  para  Caballeros,  y 

Salario  para  mujeres,  y 

1 

$60710 

$59510 

2 

— 

60440 

3 

63160 

61  340 

3 

63210 

61760 

4 

64140 

62750 

5 

65760 

63200 

5 

65590 

— 

Solucion  La  salida  impresa  MINITAB  de  regresion  para  los  datos  de  la  tabla  13.3 
se  muestra  en  la  figura  13.12.  Se  puede  usar  un  metodo  de  paso  a  paso  para  interpre¬ 
tar  este  analisis  de  regresion,  empezando  con  una  ecuacion  de  prediction  ajustada, 
y  =  58593  +  969xi  +  867x2  +  260xiX2.  Al  ajustar  x2  =  0  o  1  en  esta  ecuacion,  se  obtie- 
nen  dos  rectas,  una  para  mujeres  y  una  para  Caballeros,  para  predecir  el  valor  de  y  para 
una  xt  determinada.  Estas  rectas  son 

Mujeres:  y  =  58593  +  969^! 

Caballeros:;?  =  59460  +  1 229xi 

y  se  grafican  en  la  figura  13.13. 
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FIGURA  13.12 

Salida  impresa  MINITAB 
para  el  ejemplo  13.6 


Analisis  de  regresion:  y  contra  xl,  x2,x1x2 

The  regression  equation  is 
y  =  58593  +  969  xl  +  867  x2  +  260  xlx2 


Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

58593 . 0 

207 . 9 

281.77 

0 . 000 

xl 

969.00 

63.67 

15.22 

0 . 000 

x2 

866.7 

305.3 

2 . 84 

0 . 022 

xlx2 

260 . 13 

87 . 06 

2.99 

0 . 017 

S  =  201.344 

R-Sq  = 

99.2% 

R-Sq(adj)  = 

98.9% 

Analysis  of 

Variance 

Source 

DF 

SS 

MS 

F 

Regression 

3 

42108777 

14036259 

346.24 

Residual  Error  8 

324315 

40539 

Total 

11 

42433092 

Source 

DF  Seq 

SS 

xl 

1  33294036 

x2 

1  8452797 

xlx2 

1  361944 

A  continuation,  considere  el  ajuste  general  del  modelo  usando  el  analisis  de  la  prueba  F 
de  varianza.  Como  la  estadfstica  observada  de  prueba  en  la  parte  ANOVA  de  la  salida 
impresa  es  F  =  346.24  con  P  =  .000,  se  puede  concluir  que  al  menos  una  de  las  varia¬ 
bles  de  pronostico  esta  aportando  information  para  la  prediction  de  y.  La  fuerza  de  este 
modelo  es  medida  aun  mas  por  el  coeficiente  de  determination,  R2  =  99.2%.  Se  puede 
ver  que  el  modelo  parece  ajustar  muy  bien. 


FIGURA  13.13 

Grafica  de  las  rectas  de 
prediccion  de  salario 
del  profesorado,  para  el 
ejemplo  13.6 


Para  explorar  con  mas  detalle  el  efecto  de  las  variables  predictoras,  vea  las  praebas  t 
individuales  para  las  tres  variables  predictoras.  Los  valores  p  para  estas  praebas,  es 
decir,  .000,  .022  y  .017,  respectivamente,  son  todas  significativas,  lo  cual  quiere  decir 
que  todas  las  variables  predictoras  agregan  information  significativa  a  la  prediccion 
con  las  otras  dos  variables  ya  en  el  modelo.  Por  ultimo,  verifique  las  graficas  residuales 
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para  asegurarse  que  no  haya  grandes  violaciones  de  las  suposiciones  de  regresion.  Estas 
graficas,  que  se  comportan  como  se  esperaba  para  un  modelo  bien  ajustado,  se  ven  en 
la  figura  13.14. 


FIGURA  13.14 

Graficas  residuales  MINITAB 
para  el  ejemplo  13.6 


EJEMPLO 


Consulte  el  ejemplo  13.6.  ,'.Los  datos  dan  suficiente  evidencia  para  indicar  que  la  tasa 
anual  de  aumento,  en  salarios  de  profesores  jovenes,  es  mayor  que  la  tasa  anual  de 
aumento  en  salarios  de  profesoras  jovenes?  Es  decir,  /Jos  datos  dan  suficiente  evidencia 
para  indicar  que  la  pendiente  de  la  recta  de  salarios  de  profesores  es  mayor  que  la  pen- 
diente  de  la  recta  de  salarios  de  profesoras? 

Solucion  Como  ft  mide  la  diferencia  en  pendientes,  las  pendientes  de  las  dos  rectas 
seran  identicas  si  ft  =  0.  Por  tanto,  se  desea  probar  la  hipotesis  nula 


Ho :  ft  =  0 


esto  es,  las  pendientes  de  las  dos  rectas  son  identicas,  contra  la  hipotesis  alternativa 


ft :  ft  >  0 


esto  es,  la  pendiente  de  la  recta  de  salarios  de  profesores  es  mayor  que  la  pendiente  de  la 
recta  de  salarios  de  profesoras. 

El  valor  calculado  de  t  correspondiente  a  ft ,  que  se  ve  en  el  renglon  marcada  “xlx2” 
en  la  figura  13.12,  es  2.99.  Como  la  salida  MINITAB  de  regresion  da  valores  p  para  dos 
pruebas  de  significancia  de  dos  colas,  el  valor  p  en  la  salida  impresa,  .017,  es  el  doble 
de  lo  que  serfa  para  una  prueba  de  una  cola.  Para  esta  prueba  de  una  cola,  el  valor  p 
es  .017/2  =  .0085  y  la  hipotesis  nula  es  rechazada.  Hay  suficiente  evidencia  para  in¬ 
dicar  que  la  tasa  anual  de  aumento  en  salarios  de  profesores  excede  de  la  tasa  para 
niujercs. 


Si  desea  determinar  que  los  datos  dan  suficiente  evidencia  para  indicar  que  los  profesores  empiezan  con  salarios 
mas  altos,  probana  H0 :  (32  —  0  contra  la  hipotesis  alternativa  Ha:  fi2  >  0. 
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© 


EJERCICIOS 


TECNICAS  BASICAS 


APLICACIONES 


13.17  Rendimiento  en  produccion  Suponga 
que  se  desea  predecir  el  rendimiento  en  produccion 

y  como  funcion  de  varias  variables  independientes  de 
prediccion.  Indique  si  cada  una  de  las  siguientes 
variables  independientes  es  cualitativa  o  cuantitativa. 

Si  es  cualitativa,  defina  la(s)  variable(s)  ficticia(s) 
apropiada(s). 

a.  La  tasa  de  interes  prevaleciente  en  la  region 

b.  El  precio  por  libra  de  un  artfculo  empleado  en  el 
proceso  de  produccion 

c.  La  planta  (A,  B  o  C)  en  la  que  se  mide  el  rendimiento 
en  produccion 

d.  El  tiempo  que  la  maquina  de  produccion  haya  estado 
en  operacion 

e.  El  turno  (de  noche  o  de  dfa)  en  el  que  se  mide  el 
rendimiento 

13.18  Suponga  que  E(y)  esta  relacionada  con  dos 
variables  predictoras  jq  y  x2  por  la  ecuacion 

E(y)  =  3  +  Xi  —  2x2  +  XiX2 

a.  Grafique  la  relacion  entre  E(y)  y  x,  cuando  x2  =  0. 
Repita  para  x2  =  2  y  para  x2=  —2. 

b.  Repita  las  instrucciones  del  inciso  a)  para  el  modelo 

E(y)  =  3  +  Xi  —  2x2 

c.  Observe  que  la  ecuacion  para  el  inciso  a)  es  exac- 
tamente  igual  que  la  ecuacion  del  inciso  b), 
excepto  que  hemos  agregado  el  termino  x,x2.  (',En 
que  forma  la  adicion  del  termino  x,x2  afecta  las 
graficas  de  las  tres  rectas? 

d.  ^Que  flexibilidad  se  agrega  al  modelo  de  primer  orden 
E(y)  =  (50  +  /3 1 -V i  +  ($2x2  por  la  adicion  del  termino 
f$yX\X2,  usando  el  modelo  E(y)  =  ($0  +  fiiXi  +  ($2x2 

+  j83z,x2? 

13.19  Un  modelo  de  regresion  lineal  multiple  que 
contiene  una  variable  independiente  cualitativa  y  una 
cuantitativa  produjo  esta  ecuacion  de  prediccion: 

y  =  12.6  +  .54x,  —  1 .2x,x2  +  3.9x| 

a.  /Ciual  de  las  dos  variables  es  la  cuantitativa? 

Explique. 

b.  Si  Xi  puede  tomar  solo  los  valores  0  o  1,  encuentre 
las  dos  posibles  ecuaciones  de  prediccion  para  este 
experimento. 

c.  Grafique  las  dos  ecuaciones  halladas  en  el  inciso  b). 
Compare  las  formas  de  las  dos  curvas. 


datos  13.20  Menos  carne  roja  Los 

estadounidenses  alardean  de  que  intentan 
mejorar  su  bienestar  personal  “comiendo  bien  y 
ejercitandose  mas”.  Un  cambio  deseable  en  la  dieta  es 
reducir  la  ingesta  de  carne  roja  y  sustituir  el  polio  por 
pescado.  Unos  investigadores  dieron  seguimiento  al 
consumo  de  carne  roja  y  de  polio,  y  (en  libras  anuales 
por  persona)  y  encontraron  que  el  consumo  de  carne 
roja  disminuyo  y  el  de  polio  aumento  en  un  periodo 
de  siete  anos.  En  la  tabla  siguiente  se  ve  un  resumen  de 
sus  datos. 


Ano 

Carne  roja 

Polio 

1 

85 

37 

2 

89 

36 

3 

76 

47 

4 

76 

47 

5 

68 

62 

6 

67 

74 

7 

60 

79 

Considere  ajustar  el  siguiente  modelo,  que  toma  en 
cuenta  ajustar  simultaneamente  dos  rectas  de  regresion 
lineal  simples: 

E(y)  =  /S0  +  j8,xi  +  (32x2  +  ($3X1X2 

donde  y  es  el  consumo  anual  de  carne  (roja  o  de  polio) 
por  persona, 


[  1  si  carne  roja 
[0  si  polio 


y  x2  =  ano 


Salida  impresa  MINITAB  para  el  ejercicio  13.20 


Analisis  de  regresion:  y  contra  xi,  x2,  x1x2 

The  regression  equation  is 
y  =  23.6  +  69.0  xl  +  7.75  x2  -  12.3  xlx2 


Predictor  Coef 
Constant  23 . 571 
xl  69.000 
x2  7.7500 
xlx2  -12.286 


SE  Coef  T  P 

3.522  6.69  0.000 

4.981  13.85  0.000 

0.7875  9.84  0.000 

1.114  -11.03  0.000 


S  =  4.16705 


R-Sq  =  95.4% 


R-Sq(adj)  =  94.1% 


Analysis  of  Variance 


Source  DF 
Regression  3 
Residual  Error  10 
Total  13 


SS  MS  F  P 

3637.9  1212.6  69.83  0.000 

173.6  17.4 

3811.5 


Source  DF 

xl  1 

x2  1 

xlx2  1 


Seq  SS 

1380.1 
144 . 6 

2113.1 


Predicted  Values  for  New  Observations 
New 

Obs  Fit  SE  Fit  95%  Cl  95%  PI 

1  56.29  3.52  (48.44,  64.13)  (44.13,  68.44) 


Values  of  Predictors  for  New  Observations 
New  Obs  xl  x2  xlx2 

1  1.00  8.00  8.00 
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Graficas  MINITAB de  diagnostico  para  el  ejercicio  13.20 


a.  7,  Que  tan  bien  ajusta  el  modelo?  Use  cualesquiera 
estadisticas  relevantes  y  herramientas  de 
diagnostico  de  la  salida  impresa  para  contestar 
esta  pregunta. 

b.  Escriba  las  ecuaciones  de  las  dos  rectas  que  describen 
la  tendencia  en  consumo  durante  el  periodo  de  7  alios, 
para  carne  roja  y  para  polio. 

c.  Use  la  ecuacion  de  prediccion  para  hallar  una 
estimacion  puntual  del  promedio  de  consumo 
de  carne  roja  por  persona  en  el  alio  8.  Compare 
este  valor  con  el  valor  marcado  “ajuste”  de  la  salida 
impresa. 

d.  Use  la  salida  impresa  para  hallar  un  intervalo  de 
confianza  de  95%  para  el  promedio  de  consumo 
de  carne  roja  por  persona  en  el  alio  8.  <',Cual  es  el 
intervalo  de  prediccion  de  95%  para  el  consumo 
de  carne  roja  por  persona  en  el  alio  8?  /.Hay  algun 
problema  con  la  validez  del  nivel  de  confianza 

de  95%  para  estos  intervalos? 

(^)datos  13.21  Algodon  contra  pepinos  En  el 

ejercicio  1 1 .65  utilizamos  el  analisis  del 
procedimiento  de  varianza,  para  analizar  un 


experimento  factorial  de  2  X  3,  en  el  que  cada 
combinacion  de  factor  —  nivel  se  repitio  cinco  veces. 

El  experimento  contenia  el  numero  de  huevos  puestos  por 
moscas  blancas  enjauladas  sobre  dos  plantas  diferentes, 
a  tres  niveles  diferentes  de  temperatura.  Supongamos 
que  varias  de  las  moscas  blancas  murieron  antes  de 
completar  el  experimento,  de  modo  que  el  numero  de 
repeticiones  ya  no  fue  el  mismo  para  cada  tratamiento. 

El  analisis  de  formulas  de  varianza  del  capitulo  11  ya  no 
se  puede  usar,  pero  el  experimento  puede  ser  analizado 
usando  un  analisis  de  regresion  multiple.  Los  resultados 
de  este  experimento  factorial  de  2  x  3  con  repeticiones 
iguales  se  muestran  en  la  tabla  siguiente. 


Algodon 

Pepino 

70° 

77° 

82° 

70° 

77° 

82° 

37 

34 

46 

50 

59 

43 

21 

54 

32 

53 

53 

62 

36 

40 

41 

25 

31 

71 

43 

42 

37 

69 

49 

31 

48 

51 

a.  Escriba  un  modelo  para  analizar  este  experimento. 
Asegurese  de  incluir  un  termino  para  la  interaccion 
entre  planta  y  temperatura. 

b.  Use  un  paquete  de  software  para  efectuar  el  analisis  de 
regresion  multiple. 

c.  (',Los  datos  dan  suficiente  evidencia  para  indicar  que  el 
efecto  de  temperatura  en  el  numero  de  huevos  puestos 
es  diferente  dependiendo  del  tipo  de  planta? 

d.  Con  base  en  los  resultados  del  inciso  c),  (',sugiere 
usted  reajustar  un  modelo  diferente?  Si  es  asl,  vuelva  a 
correr  el  analisis  de  regresion  usando  el  nuevo  modelo 
y  analice  la  salida  impresa. 

e.  Escriba  un  parrafo  que  resuma  los  resultados  de  sus 
analisis. 

(^)datos  13.22  Calificaciones  de  rendimiento  III 

El  Indice  de  Rendimiento  Academico  (API), 
descrito  en  el  ejercicio  12.11,  es  una  medida  del 
rendimiento  escolar  con  base  en  los  resultados  del 
Examen  de  Rendimiento  Stanford  9.  Las  calificaciones 
del  API  para  ocho  escuelas  elementales  en  el  condado  de 
Riverside,  California,  se  muestran  a  continuacion  junto 
con  varias  variables  independientes  mas.5 


Escuela 

Calificacion  API  y 

Premios  x, 

%  de  comidas  x2 

1 

588 

SI 

58 

2 

659 

No 

62 

3 

710 

SI 

66 

4 

657 

No 

36 

5 

669 

No 

40 

6 

641 

No 

51 

7 

557 

No 

73 

8 

743 

SI 

22 

www.FreeLibros.me 


574  O  CAPiTULO  13  ANALISIS  DE  REGRESION  MULTIPLE 


Escuela  %ELLx3  %  de  emergencia  x4  API  del  ano  previo  x5 


1 

34 

16 

533 

2 

22 

5 

655 

3 

14 

19 

695 

4 

30 

14 

680 

5 

11 

13 

670 

6 

26 

2 

636 

7 

39 

14 

532 

8 

6 

4 

705 

Regresion  de  mejores  subconjuntos:  y  contra  xl,  x2,  x3,  x4,  x5 

Response  is  y 


R-Sq 

Mallows 

X 

X 

X 

X 

X 

Vars 

R-Sq 

(adj  ) 

C-p 

S 

1 

2 

3 

4 

5 

1 

87 . 9 

85 . 8 

132 . 7 

22 . 596 

X 

1 

84 . 5 

81 . 9 

170 . 7 

25 . 544 

X 

2 

97.4 

96.4 

27 . 1 

11.423 

X 

X 

2 

94.6 

92.4 

58 . 8 

16 . 512 

X 

X 

3 

99.0 

98.2 

11 . 8 

8 . 1361 

X 

X 

X 

3 

98 . 9 

98.2 

11.9 

8 . 1654 

X 

X 

X 

4 

99.8 

99.6 

4 . 0 

3 .8656 

X 

X 

X 

X 

4 

99.0 

97 . 8 

12 . 8 

8 . 9626 

X 

X 

X 

X 

5 

99.8 

99.4 

6 . 0 

4 . 7339 

X 

X 

X 

X 

X 

Las  variables  estan  definidas  como 

Xi  =  1  si  la  escuela  recibio  un  premio  financiero 

por  cumplir  objetivos  de  crecimiento,  0  si  no  lo 
recibio 

x2  =  %  de  estudiantes  que  calificaron  para  comidas  gratis 
o  a  precios  bajos 

x3  =  %  de  estudiantes  que  estudian  ingles 


13.23  tabla  de  parti'culas  Un  ingeniero  de  control 
de  calidad  esta  interesado  en  predecir  la  resistencia  de 
una  tabla  de  parti'culas  y,  como  funcion  del  tamano  de  las 
parti'culas  x,  y  dos  tipos  de  compuestos  aglutinantes.  Si  se 
espera  que  la  respuesta  basica  sea  una  funcion  cuadratica 
del  tamano  de  una  partfcula,  escriba  un  modelo  lineal  que 
incorpore  la  variable  cualitativa  “compuesto  aglutinante” 
en  la  ecuacion  de  prediccion. 


x4  =  %  de  profesores  con  credenciales  de  emergencia 
xs  =  Calificacion  API  en  2000 

La  salida  impresa  MINITAB  para  un  modelo  de  regresion 
de  primer  orden  se  da  a  continuacion. 


Analisis  de  regresion:  y  contra  xl,  x2,  x3,  x4,  x5 

The  regression  equation  is 
y  =  269  +  33.2  xl  -  0.003  x2  -  1.02  x3 
-  1.00  x4  +  0.636  x5 


Predictor 

Coef 

STDev 

T 

P 

Constant 

269 . 03 

41.55 

6.48 

0 . 023 

xl 

33.227 

4.373 

7 .60 

0 . 017 

x2 

-0 . 0027 

0 . 1396 

-0 . 02 

0 . 987 

x3 

-1 . 0159 

0.3237 

-3 . 14 

0 . 088 

x4 

-1 . 0032 

0.3391 

-2 . 96 

0 . 098 

x5 

0 . 63560 

0 . 05209 

12.20 

0 . 007 

S  =  4.73394 

R-Sq  = 

99.8% 

R-Sq (adj ) 

=  99  .  - 

Analysis  of 
Source 

Variance 

DF 

SS 

MS 

F 

Regression 
Residual  Error 
Total 


25197.2 
44 . 8 
25242 . 0 


5039.4 

22.4 


P 

.  004 


a.  ('Cual  es  el  modelo  que  se  ha  ajustado  a  estos  datos? 

b.  ^Que  tan  bien  se  ajusta  el  modelo?  Use  cualesquier 
estadistico  relevante  de  la  salida  impresa  para 
contestar  esta  pregunta. 

c.  <'  Cuales  de  las  variables  independientes, 

si  las  hay,  son  utiles  para  predecir  el  API,  dadas 
las  otras  variables  independientes  ya  en  el  modelo? 
Explique. 

d.  Use  los  valores  de  R 2  y  /L(adj)  de  la  siguiente  salida 
impresa  para  escoger  el  mejor  modelo  para  prediccion. 
('Confiarfa  usted  en  usar  el  modelo  escogido,  para 
predecir  la  calificacion  API  para  el  siguiente  ano,  con 
base  en  un  modelo  que  contenga  variables  similares? 
Explique. 


(^)datos  13.24  Proyectos  de  construccion 

En  un  estudio  para  examinar  la  relation 
entre  el  tiempo  requerido  para  completar  un  proyecto 
de  construccion  y  varias  variables  independientes 
pertinentes,  un  analista  compilo  una  lista  de  cuatro 
variables  que  podrfan  ser  utiles  para  predecir  el  tiempo  de 
termination.  Estas  cuatro  variables  eran  el  tamano  del 
contrato,  x,  (en  unidades  de  $1000),  el  numero  de  dfas 
de  trabajo  adversamente  afectados  por  el  clima  x2,  el 
numero  de  subcontratistas  involucrados  en  el  proyecto 
x4  y  una  variable  x3  que  midio  la  presencia  (x3  =  1) 
o  ausencia  (x3  =  0)  de  una  huelga  de  trabaj  adores  durante 
la  construccion.  Se  escogieron  al  azar  15  proyectos  de 
construccion  y  se  midieron  cada  una  de  las  cuatro 
variables,  as!  como  el  tiempo  para  terminar  el  proyecto. 
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Un  analisis  de  estos  datos  usando  un  modelo  de  primer 
orden  en  xu  x2,  x3  y  x4  produjo  la  siguiente  salida  impresa. 
De  un  analisis  completo  de  la  salida  impresa  e  interprete 
sus  resultados.  ^Que  se  puede  decir  acerca  de  la  aparente 
contribution  de  xt  y  x2  en  la  prediccion  de  y? 
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Analisis  de  regresion:  y  contra  xl,  x2,  x3,  x4 

The  regression  equation  is 


y  =  -1.6  - 

0.00784  xl  + 

0.68  x2 

+  28.0  x3 

+  3.49 

x4 

Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

-1.59 

11 . 66 

-0 . 14 

0 . 894 

xl 

-0 . 007843 

0 . 006230 

-1.26 

0.237 

x2 

-0.6753 

0 . 9998 

0 . 68 

0.515 

x3 

28 . 01 

11.37 

2.46 

0 . 033 

x4 

3.489 

1.935 

1 . 80 

0 . 102 

S  =  11.8450 

R-Sq 

=  84.7% 

R-Sq(adj)  =  78 

.  6% 

Analysis  of 

Variance 

Source 

DF 

SS 

MS 

F 

P 

Regression 

4 

7770.3 

1942.6  13 

.85  0 . 

000 

Residual  Error  10 

1403 . 0 

140.3 

Total 

14 

9173.3 

Source  DF 
XI  1 

x2  1 

x3  1 

x4  1 


Seq  SS 
1860 . 9 
2615.3 
2838 . 0 
456 . 0 


Residuales  contra  valores  ajustados 

(la  respuesta  es  y) 

20-| - 


10- 

s 

3  °“- 

sS 

-10- 


-20-1 — , _ , _ j j j j j _ ,J 

10  20  30  40  50  60  70  80 

Valores  ajustados 


Grafica  normal  de  probabilidad  de  los  residuales 

(la  respuesta  es  y) 


PRUEBA  DE  CONJUNTOS  DE  COEFICIENTES 
DE  REGRESION 

En  las  secciones  precedentes,  hemos  probado  el  conjunto  completo  de  coeficientes  de 
regresion  parcial  usando  la  prueba  F  para  el  ajuste  general  del  modelo  y  hemos  probado 
los  coeficientes  de  regresion  parcial  individualmente  usando  la  prueba  t  de  Student. 
Ademas  de  estas  dos  importantes  pruebas,  se  pueden  probar  hipotesis  acerca  de  algunos 
subconjuntos  de  estos  coeficientes  de  regresion. 

Por  ejemplo,  suponga  que  una  companfa  sospecha  que  la  demanda  y  de  al gun  pro- 
ducto  podrfa  estar  relacionada  con  hasta  cinco  variables  independientes:  xu  x2,  x3,  x4  y  x5. 
El  costo  de  obtener  mediciones  de  las  variables  x3,  x4  y  x5  es  muy  alto.  Si,  en  un  pequeno 
estudio  piloto,  la  companfa  pudiera  demostrar  que  estas  tres  variables  contribuyen  con 
poca  o  ninguna  information  para  la  prediction  de  y,  pueden  ser  eliminadas  del  estudio 
con  grandes  ahorros  para  la  companfa. 

Si  las  cinco  variables,  xh  x2,  x3,  x4  y  x5,  se  usan  para  predecir  y,  el  modelo  de  regresion 
se  escribiria  como 


y  =  /3(l  +  f3,xt  +  fi2x2  +  PiKj  +  fi4x4  +  (35x5  +  e 
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No  obstante,  si  x3,  x4  y  x5  no  aportan  informacion  para  la  prediccion  de  y,  entonces  no 
aparecerfan  en  el  modelo,  es  decir,  /33  =  /34  =  /35  =  0  y  el  modelo  reducido  serfa 

y  =  Po  +  jSiJCi  +  fi2x2  +  e 
En  consecuencia,  se  desea  probar  la  hipotesis  nula 

H0 :  fi3  =  fi4  =  p5  =  0 

esto  es,  las  variables  independientes  x3,  x4  y  x5  no  aportan  informacion  para  la  prediccion 
de  y,  contra  la  hipotesis  alternativa 

Ha :  A1  menos  uno  de  los  parametros  /33,  /34  o  (35  es  diferente  de  0 

es  decir,  al  menos  una  de  las  variables  x3,  x4  y  x5  aporta  informacion  para  la  predic¬ 
cion  de  y.  Entonces,  para  decidir  si  el  modelo  completo  es  preferible  al  modelo  reduci¬ 
do  para  predecir  demanda,  vamos  a  una  prueba  de  hipotesis  acerca  de  un  conjunto  de 
tres  parametros,  yS3,  /34  y  /35. 

Una  prueba  de  hipotesis  respecto  a  un  conjunto  de  parametros  de  modelo  involucra 
dos  modelos: 

Modelo  1  (modelo  reducido) 

E(y)  =  j80  +  /3i.*i  +  p2x2  +  ‘  '  ‘  +  f3,xr 

Modelo  2  (modelo  completo) 

E(y)  =  Po  +  P\X\  +  p2x2  +  •  •  •  +  fi,xr  +  pr+1xr+i  +  pr+2xr+2  +  •  ■  ■  pkxk 

terminos  en  modelo  1  terminos  adicionales  en  modelo  2 

Suponga  que  se  ajustaron  ambos  modelos  al  conjunto  de  datos  y  se  calculo  la  suma  de 
cuadrados  para  el  error  de  los  dos  analisis  de  regresion.  Si  el  modelo  2  aporta  mas  infor¬ 
macion  para  la  prediccion  de  y  que  el  modelo  1 ,  entonces  los  errores  de  prediccion  para 
el  modelo  2  deben  ser  mas  pequenos  que  los  correspondientes  errores  para  el  modelo  1 , 
y  la  SSEi  debe  ser  menor  que  la  SSE,.  De  hecho,  cuanto  mayor  sea  la  diferencia  entre 
SSE  y  SSE2,  mayor  es  la  evidencia  para  indicar  que  el  modelo  2  aporta  mas  informacion 
para  la  prediccion  de  y  que  el  modelo  1 . 

La  prueba  de  la  hipotesis  nula 

H0  '■  Pr+ 1  =  Pr+2  ~  ~  Pk  =  0 

contra  la  hipotesis  alternativa 

Ha :  Al  menos  uno  de  los  parametros  /3,+i,  /3,+2,  . . . ,  /U  difiere  de  0 
utiliza  el  estadfstico  de  prueba 
(SSE,  -  SSE 2)/(k  -  r) 

mse2 

donde  F  esta  basada  en  dfx  =  {k  —  r)  y  df2  =  n  —  (k  +  1).  Observe  que  los  parametros  ( k 
—  r)  contenidos  en  H0  son  los  sumados  al  modelo  1  para  obtener  el  modelo  2.  Los  grados 
de  libertad  df\  del  numerador  siempre  son  iguales  a  (k  —  r ),  que  es  el  niimero  de  para¬ 
metros  contenidos  en  H0.  Los  grados  de  libertad  df2  del  denominador  es  el  numero  de 
grados  de  libertad  asociado  con  la  suma  de  cuadrados  para  error,  SSE2,  para  el  modelo 
completo. 

La  region  de  rechazo  para  la  prueba  es  identica  a  la  region  de  rechazo  para  todos  los 
analisis  de  pruebas  F  de  varianza,  es  decir, 

F  >  Fa 
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Consulte  los  datos  de  bienes  rafces  del  ejemplo  13.2  que  relacionan  el  precio  de  venta  de 
lista  y  con  la  superficie  en  pies  cuadrados  del  area  de  vivienda  xu  el  niimero  de  pisos 
x2,  el  numero  de  recamaras  x3  y  el  niimero  de  banos,  x4.  El  agente  de  bienes  rafces  sos- 
pecha  que  la  superficie  en  pies  cuadrados  del  area  de  vivienda  es  la  variable  predictora 
mas  importante,  y  que  las  otras  variables  podrfan  ser  eliminadas  del  modelo  sin  perder 
mucha  informacion  de  prediccion.  Pruebe  esta  afirmacion  con  a  =  .05. 


Solucion  La  hipotesis  a  probar  es 
Ho  '■  ft  =  ft  =  =  0 

contra  la  hipotesis  alternativa  que  al  menos  una  de  /32,  /33  o  /34  es  diferente  de  0.  El 

modelo  completo  2,  dado  como 


y  =  Po  +  )8iXi  +  /32x2  +  |S3x3  +  fB^x^  +  e 


fue  ajustado  en  el  ejemplo  13.2.  Una  parte  de  la  salida  impresa  MINITAB  de  la  figura  13.3 
se  reproduce  en  la  figura  13.15  junto  con  una  parte  de  la  salida  impresa  MINITAB  para  el 
analisis  de  regresion  lineal  simple  del  modelo  reducido  1,  dado  como 

y  =  Po  +  /3,x,  +  e 


FIGURA  13.15 

Partes  de  las  salidas 
impresas  de  regresion 
MINITAB  para  modelos 
a)  completo  y  b)  reducido 
para  el  ejemplo  13.8 


Analisis  de  regresion:  a)  precio  de  lista  contra  pies  cuadrados,  numero  de  pisos,  recamaras  y  banos 

S  =  6.84930  R-Sq  =  97.1%  R-Sq(adj)  =  96.0% 

Analysis  of  Variance 


Source 

DF 

SS 

MS 

F 

P 

Regression 

4 

15913 . 0 

3978.3 

84 . 80 

0 . 000 

Residual  Error 

10 

469.1 

46 . 9 

Total 

14 

16382.2 

Analisis  de  regresion:  b)  precio  de  lista  contra  pies  cuadrados 

S  =  10.9294  R-Sq  =  90.5%  R-Sq(adj)  =  89.8% 


Analysis  of  Variance 


Source 

DF 

SS 

MS 

F 

P 

Regression 

1 

14829 

14829 

124 . 14 

0 . 000 

Residual  Error 

13 

1553 

119 

Total 

14 

16382 

Entonces  SSE[  =  1553  de  la  figura  13.15b)  y  SSE:  =  469.1  y  MSE2  =  46.9  de  la  figura 
13.15a).  El  estadfstico  de  prueba  es 

_  (SSE,  -  SSE2)/(£  -  r) 

F  ~  mse2 

(1553  —  469.  l)/(4  -  1) 

= 1 1  = 7-70 


El  valor  crftico  de  F  con  a  =  .05,  dfi  =  3  y  df2  =  n  —  (k  +  1)  =  15  —  (4  +  1)  =  10  es 
F05  =  3.7 1 .  Por  tanto,  H0  es  rechazada.  Hay  evidencia  para  indicar  que  al  menos  una  de 
las  tres  variables  que  son  numero  de  pisos,  recamaras  o  banos,  esta  contribuyendo  con 
informacion  significativa  para  predecir  el  precio  de  venta  de  lista. 
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INTERPRETACION  DE  GRAFICAS 
RESIDUALES 

Una  vez  mas,  se  pueden  usar  graficas  residuales  para  descubrir  posibles  violaciones  en 
las  suposiciones  requeridas  para  un  analisis  de  regresion.  Hay  varios  patrones  comunes 
que  se  deben  reconocer  porque  se  presentan  con  frecuencia  en  aplicaciones  practicas. 


•  Los  datos  de  Poisson  exhiben  variation  que  aumenta  con  la  media. 

•  Los  datos  binomiales  exhiben  variation  que  aumenta  para  valores  de  p  de  .0  a  .5 
y  luego  disminuye  para  valores  de  p  de  .5  a  1.0. 


FIGURA  13.16 

Graficas  de  residuales 
contra  y 


Las  graficas  residuales  para  estos  tipos  de  datos  tienen  un  patron  semejante  al  que  se  ve 
en  la  figura  13.16. 


2 

1 

0 

-1 

-2 


2  3  4  y 

a)  Datos  de  Poisson 


L 


L 


50  100  y 

b)  Porcentajes  binomiales 


Si  el  rango  de  los  residuales  aumenta  cuando  y  aumenta  y  se  sabe  que  los  datos  son 
mediciones  sobre  variables  de  Poisson,  se  puede  estabilizar  la  varianza  de  la  respuesta  al 
correr  el  analisis  de  regresion  en  y*  =  \/y.  O  bien,  si  los  porcentajes  se  calculan  a  partir 
de  datos  binomiales,  se  puede  usar  la  transformation  arcsen,  y*  =  sen^y/y.1 

Incluso  si  no  se  esta  seguro  de  por  que  el  rango  de  los  residuales  aumenta  cuando  y 
aumenta,  todavfa  se  puede  usar  una  transformation  de  y  que  afecta  valores  mas  grandes  de 
y  mas  que  valores  pequenos,  por  ejemplo  y*  =  \/y  o  y*  =  In  y.  Estas  transformaciones 
tienen  una  tendencia  para  estabilizar  la  varianza  de  y*  y  para  hacer  que  la  distribution  de 
y*  sea  mas  casi  normal  cuando  la  distribution  de  y  sea  altamente  sesgada. 

Es  frecuente  que  las  graficas  de  los  residuales  contra  los  ajustes  y  o  contra  las  variables 
predictoras  individuales  muestren  un  patron  que  indica  que  se  ha  escogido  un  modelo 
incorrecto.  Por  ejemplo,  si  E(y)  y  una  sola  variable  independiente  x  estan  linealmente 
relacionadas,  es  decir, 


E(y)=  Po  +  fax 

y  se  ajusta  una  recta  a  los  datos,  entonces  los  valores  y  observados  deben  variar  en  una 
forma  aleatoria  alrededor  de  y,  y  una  grafica  de  los  residuales  contra  x  aparecera  como 
se  ve  en  la  figura  13.17. 

FIGURA  13.17  - 

Grafica  residual  cuando 
el  modelo  da  una  buena 
aproximacion  a  la  realidad 


+  En  el  capftulo  1 1  y  anteriores,  representamos  la  respuesta  variable  con  el  sfmbolo  x.  En  los  capftulos  sobre  analisis 
de  regresion,  capftulos  12  y  13,  la  variable  de  respuesta  esta  representada  por  el  sfmbolo  y. 
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FIGURA  13.18 

Grafica  residual  para 
ajuste  lineal  de  tamano 
de  tienda  y  datos  de 
productividad  en  el 
ejemplo  13.3 


FIGURA  13.19 

Grafica  residual  para 
ajuste  lineal  de  datos  de 
salario  en  el  ejemplo  13.6 


En  el  ejemplo  13.3,  se  ajusto  un  modelo  cuadratico  que  relacionaba  la  productividad 
y  con  el  tamano  de  tienda  x.  Si  incorrectamente  se  hubiera  usado  un  modelo  lineal  para 
ajustar  estos  datos,  la  grafica  residual  de  la  figura  13.18  mostrarfa  que  la  variacion  no 
explicada  exhibe  un  patron  curvado,  que  sugiere  que  hay  un  efecto  cuadratico  que  no  se 
ha  incluido  en  el  modelo. 


Residuales  contra  los  valores  ajustados 

(la  respuesta  es  y) 


0.5- 


•g 

a! 


3.2  3.4 

Valor  ajustado 


Para  los  datos  del  ejemplo  13.6,  los  residuales  de  una  regresion  lineal  de  salario  con 
anos  de  experiencia  x,  sin  incluir  genero,  x2,  mostrana  un  conjunto  distinto  de  residua¬ 
les  positivos  correspondientes  a  los  Caballeros  y  un  conjunto  de  residuales  negativos 
conespondientes  a  las  mujeres  (vease  la  figura  13.19).  Este  patron  senala  que  la  variable 
“genero”  no  estaba  incluida  en  el  modelo. 


Residuales  contra  los  valores  ajustados 

(la  respuesta  es  y) 


60  000  61  000  62  000  63  000  64  000  65  000 


Valor  ajustado 


Desafortunadamente,  no  todas  las  graficas  residuales  dan  una  indication  tan  clara 
del  problema.  Con  todo  cuidado  deben  examinarse  las  graficas  residuales,  buscando 
que  no  haya  aleatoriedad  en  el  modelo  de  residuales.  Si  se  puede  hallar  una  explication 
para  el  comportamiento  de  los  residuales,  se  puede  modificar  el  modelo  para  eliminar 
el  problema. 


anAlisis  de  regresion  POR  PASOS 


A  veces  hay  un  gran  niimero  de  variables  predictoras  independientes  que  podrian  tener 
un  efecto  en  la  variable  de  respuesta  y.  Por  ejemplo,  trate  de  hacer  una  lista  de  todas  las 
variables  que  podrian  afectar  el  promedio  de  calificaciones  (GPA)  de  un  estudiante  de 
primer  ano  de  universidad: 


•  Calificaciones  en  cursos  de  preparatoria,  promedio  de  calificaciones  de  prepa- 
ratoria,  calificacion  de  examen  de  aptitud  escolar,  calificacion  de  examen  en 
universidades 
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•  Especialidad,  numero  de  unidades  llevadas,  numero  de  cursos  tornados 

•  Programa  de  trabajo,  estado  civil,  viaja  o  vive  en  el  plantel 

<;Cual  de  este  gran  numero  de  variables  independientes  deben  incluirse  en  el  modelo? 
Como  el  numero  de  terminos  podrfa  rapidamente  hacerse  muy  dificil  de  manejar,  podrfa 
escogerse  usar  un  procedimiento  llamado  analisis  de  regresion  por  pasos,  que  se  pone 
en  practica  por  computadora  y  lo  hay  en  casi  todos  los  paquetes  de  estadistica. 

Suponga  que  tenemos  datos  acerca  de  y  y  un  buen  numero  de  posibles  variables 
independientes,  X\,  x2,  ...,  xk.  Un  analisis  de  regresion  por  pasos  ajusta  una  variedad  de 
modelos  a  los  datos,  agregando  y  eliminando  variables  cuando  la  significancia  de  ellas 
en  presencia  de  las  otras  variables  es  significativa  o  no  significativci,  respectivamente. 
Una  vez  que  el  programa  haya  hecho  un  numero  suficiente  de  iteraciones  y  no  hay 
mas  variables  significativas  cuando  se  suman  al  modelo  y  ninguna  de  las  variables  del 
modelo  son  no  significativas  cuando  son  eliminadas,  el  procedimiento  se  detiene. 

Un  analisis  de  regresion  por  pasos  es  un  modo  facil  de  localizar  algunas  variables  que 
aportan  informacion  para  predecir  y,  pero  no  es  a  prueba  de  errores.  Como  estos  progra- 
mas  siempre  ajustan  modelos  de  primer  orden  de  la  forma 

E(y)  =  fS0  +  /3iXi  +  /32x2  +  •  •  •  +  (3kxk 

no  son  utiles  para  detectar  curvatura  o  interaccion  en  los  datos.  El  analisis  de  regresion 
por  pasos  se  usa  mejor  como  herramienta  preliminar  para  identificar  cual,  de  un  gran 
numero  de  variables,  debe  ser  considerada  en  su  modelo.  Entonces  es  necesario  decidir 
como  introducir  estas  variables  en  el  modelo  real  que  usara  para  prediccion. 

INTERPRETACION  ERRONEA 
DE  UN  ANALISIS  DE  REGRESION 

Son  comunes  varias  interpretaciones  erroneas  en  la  salida  impresa  de  un  analisis  de 
regresion.  Ya  hemos  mencionado  la  importancia  de  la  seleccion  de  un  modelo.  Si  un 
modelo  no  se  ajusta  a  un  conjunto  de  datos,  no  quiere  decir  que  las  variables  incluidas 
en  el  modelo  aporten  poca  o  ninguna  informacion  para  la  prediccion  de  y.  Las  variables 
pueden  ser  importantes  contribuyentes  de  informacion,  pero  pueden  haberse  introducido 
las  variables  en  el  modelo  en  una  forma  equivocada.  Por  ejemplo,  un  modelo  de  segun- 
do  orden  en  las  variables  podrfa  dar  un  muy  buen  ajuste  a  los  datos  cuando  un  modelo  de 
primer  orden  parece  ser  por  completo  inutil  para  describir  la  variable  de  respuesta  y. 

Causalidad 

Es  necesario  tener  cuidado  de  no  concluir  que  cambios  en  x  causan  cambios  en  y.  Este 
tipo  de  relacion  causal  puede  ser  detectada  solo  con  un  ex perimento  cuidadosamente 
disenado.  Por  ejemplo,  si  al  azar  se  asignan  unidades  experimentales  a  cada  uno  de  dos 
niveles  de  una  variable  x,  por  ejemplo  x  =  5  y  x  =  lOylos  datos  muestran  que  el  valor 
medio  de  y  es  mayor  cuando  x  =  1 0,  entonces  se  puede  decir  que  el  cambio  en  el  nivel 
de  x  causo  un  cambio  en  el  valor  medio  de  y.  Pero  en  casi  todos  los  analisis  de  regresion, 
en  los  que  los  experimentos  no  estan  disenados,  no  hay  garantfa  de  que  una  variable 
predictora  importante,  por  ejemplo  xu  cause  un  cambio  en  y.  Es  muy  posible  que  alguna 
variable  que  ni  siquiera  este  en  el  modelo  cause  que  tan  to  y  como  x2  cambien. 

Multicolinealidad 

Ni  el  tamano  de  un  coeficiente  de  regresion  ni  su  valor  t  indican  la  importancia  de  la 
variable  como  contribuyente  de  informacion.  Por  ejemplo,  supongamos  que  se  desea  pre¬ 
decir  y,  la  calificacion  de  calculo  de  un  estudiante  universitario,  con  base  en  x,  =  prome- 
dio  de  calificaciones  de  preparatoria  y  x2  =  calificacion  en  el  examen  de  aptitud  en 
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matematicas.  Como  estas  dos  variables  contienen  mucho  de  lo  mismo  o  informacion 
compartida,  no  es  de  soiprender  que  una  vez  que  una  de  las  variables  se  introduzca 
en  el  modelo,  la  otra  aporta  muy  poca  informacion  adicional.  El  valor  t  individual  es 
pequeno,  pero,  si  las  variables  se  introdujeron  en  el  orden  inverso,  se  verfa  invertido  el 
tamano  de  los  valores  t. 

La  situacion  descrita  lineas  antes  se  denomina  multicolinealidad  y  se  presenta 
cuando  dos  o  mas  de  las  variables  predictoras  estan  altamente  correlacionadas  entre  si. 
Cuando  la  multicolinealidad  esta  presente  en  un  problema  de  regresion,  puede  tener 
estos  efectos  en  el  analisis: 

•  Los  coeficientes  de  regresion  estimados  tendran  errores  estandar  grandes,  causan- 
do  imprecision  en  intervalos  de  confianza  y  prediccion. 

•  Agregar  o  eliminar  una  variable  de  prediccion  puede  causar  cambios  significati- 
vos  en  los  valores  de  los  otros  coeficientes  de  regresion. 

^Como  saber  si  un  analisis  de  regresion  exhibe  multicolinealidad?  Busque  estos 
indicios: 

•  El  valor  de  R 2  es  grande,  lo  cual  indica  un  buen  ajuste,  pero  las  pruebas  t  indivi¬ 
duals  no  son  significativas. 

•  Los  signos  de  los  coeficientes  de  regresion  son  contrarios  a  lo  que  intuitivamente 
se  esperarfa  fueran  las  contribuciones  de  esas  variables. 

•  Una  matriz  de  correlaciones,  generada  por  computadora,  muestra  cuales  variables 
predictoras  estan  altamente  correlacionadas  entre  sf  y  con  la  respuesta  y. 

La  figura  13.20  muestra  la  matriz  de  correlaciones  generada  para  los  datos  de  bienes 
rafces  del  ejemplo  13.2.  La  primera  columna  de  la  matriz  muestra  las  correlaciones  de 
cada  variable  de  prediccion  con  la  variable  de  respuesta  y.  Todas  son  significativamen- 
te  diferentes  de  cero,  pero  la  primera  variable,  xx  =  area  de  vivienda,  es  la  mas  altamente 
correlacionada.  Las  ultimas  tres  columnas  de  la  matriz  muestran  correlaciones  significa¬ 
tivas  entre  todas  las  variables  predictoras,  excepto  un  par.  Esta  es  una  fuerte  indication 
de  multicolinealidad.  Si  se  trata  de  eliminar  una  de  las  variables  del  modelo,  pueden  cam- 
biar  en  forma  drastica  los  efectos  de  las  otras  tres.  Otro  indicio  puede  hallarse  al  exami- 
nar  los  coeficientes  de  la  recta  de  prediccion, 

ListPrice  =  119  +  6.27  Square  Feet—  16.2  Number  of  Floors 
-  2.67  Bedrooms  +  30.3  Baths 

FIGURA  13.20 


- w 

Matriz  de  correlacion  para 

Correlaciones:  Precio  de  lista,  pies  cuadrados,  numero  de  pisos,  recamaras,  banos 

los  datos  de  bienes  rafces 
del  ejemplo  13.2 

Square  Feet 

ListPrice 
0 . 951 

0 .000 

SqFeet 

Numf lrs 

Bdrms 

Number  of  FI 

0 .605 

0 . 017 

0 . 630 
0 . 012 

Bedrooms 

0 . 746 

0 .001 

0 . 711 
0 . 003 

0.375 

0 . 168 

Baths 

0 . 834 

0 .000 

0 . 720 
0 . 002 

0.760 

0 . 001 

0 . 675 

0 . 006 

Cell  Contents 

:  Pearson 
P-Value 

Correlation 

Se  podrfa  esperar  que  mas  pisos  y  recamaras  aumentaran  el  precio  de  lista,  pero  sus 
coeficientes  son  negativos. 

Como  existe  multicolinealidad  en  alguna  medida  en  todos  los  problemas  de  regresion, 
debemos  considerar  los  terminos  individuales  como  aportadores  de  informacion,  en  lugar  de 
tratar  de  medir  la  importancia  practica  de  cada  termino.  La  decision  primaria  a  tomarse  es 
si  un  termino  aporta  suficiente  informacion  para  justificar  su  inclusion  en  el  modelo. 
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PASOS  A  SEGUIR  AL  CONSTRUIR 
UN  MODELO  DE  REGRESION  MULTIPLE 


El  objetivo  final  de  un  analisis  de  regresion  multiple  es  desarrollar  un  modelo  que 
en  forma  precisa  prediga  y  como  funcion  de  un  conjunto  de  variables  predictoras  xh 
x2,  ...,  xt.  El  procedimiento  paso  a  paso  para  desarrollar  este  modelo  se  presento  en  la 
seccion  13.4  y  volvemos  a  expresarlo  a  continuation  con  algun  detalle  adicional.  Si  se 
usa  este  metodo,  lo  que  puede  parecer  un  problema  complicado  se  puede  hacer  mas 
sencillo.  A1  igual  que  en  cualquier  procedimiento  estadistico,  la  confianza  crecera  a 
medida  que  ganemos  experiencia  con  el  analisis  de  regresion  multiple  en  varias  situa- 
ciones  practicas. 


1.  Seleccione  las  variables  predictoras  a  ser  incluidas  en  el  modelo.  Como  algunas 
de  estas  variables  pueden  contener  informacion  compartida,  se  puede  reducir  la 
lista  al  correr  un  analisis  de  regresion  por  pasos  (vease  la  seccion  13.8). 

Mantenga  el  niimero  de  variables  predictoras  lo  suficientemente  pequeno  para 
que  sea  efectivo  pero  manejable.  Es  necesario  estar  conscientes  que  el  niimero 
de  observaciones  del  conjunto  de  datos  debe  exceder  el  niimero  de  terminos  del 
modelo;  cuanto  mayor  el  exceso,  mejor. 

2.  Escriba  un  modelo  usando  las  variables  predictoras  seleccionadas.  Si  las  varia¬ 
bles  son  cualitativas,  es  mejor  empezar  incluyendo  terminos  de  interaction;  si  las 
variables  son  cuantitativas,  es  mejor  empezar  con  un  modelo  de  segundo  orden. 
Los  terminos  no  necesarios  pueden  eliminarse  despues.  Obtenga  el  modelo  de 
prediction  ajustado. 

3.  Use  el  analisis  de  varianza  de  la  prueba  F  y  R2  para  determinar  que  tan  bien 
ajusta  el  modelo  a  los  datos. 

4.  Verifique  las  pruebas  t  para  los  coeficientes  de  regresion  partial  para  ver  cuales 
estan  aportando  informacion  significativa  en  presencia  de  los  otros.  Si  algunos 
terminos  parecen  ser  no  significativos,  considere  eliminarlos.  Si  escoge  comparar 
varios  modelos  diferentes,  use  /?“(adj)  para  comparar  su  efectividad. 

5.  Use  graficas  residuales  generadas  por  computadora  para  ver  si  hay  violation  de 
las  suposiciones  de  regresion. 


REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  El  modelo  lineal  general 

1.  y  =  ft  +  ftvi  +  ftx2  +  ■  •  •  +  /3kxk  4-  e 

2.  El  error  aleatorio  e  tiene  una  distribution  normal 
con  media  0  y  varianza  a2. 

II.  Metodo  de  minimos  cuadrados 

1.  Las  estimaciones  b0,  bu  ...,  bk,  para  ft,  ft,  ...,  ft, 
se  escogen  para  minimizar  SSE,  la  suma 

del  cuadrado  de  desviaciones  alrededor  de  la 
recta  de  regresion,  y  =  b0  +  bxx x  +  b2x2  + 

■  ■  ■  +  b^k. 

2.  Las  estimaciones  de  minimos  cuadrados  son 
producidas  por  computadora. 


III.  Analisis  de  varianza 


1.  SS  Total  =  SSR  +  SSE,  donde  SS  Total  =  Syy. 
La  tabla  ANOVA  es  producida  por  computadora. 

2.  La  mejor  estimation  de  cr2  es 


MSE 


SSE 

n  —  k  —  1 


IV.  Prueba,  estimation  y  prediction 

1 .  Una  prueba  de  la  significancia  de  la  regresion, 

H0  :  ft  =  ft  =  ■  ■  ■  =  ft  =  0,  se  puede  implemen- 
tar  usando  el  analisis  de  prueba  F  de  varianza: 

MSR 

F  = - 

MSE 
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2.  La  fuerza  de  la  relation  entre  x  y  y  se  puede  medir 
usando 

2  _  _SSR_ 

SS  Total 

lo  cual  se  acerca  a  1  cuando  la  relation  se  hace 
mas  fuerte. 

3.  Use  graficas  residuales  para  verificar  si  hay 
no  normalidad,  desigualdad  de  varianzas  y  un 
modelo  incorrectamente  ajustado. 

4.  Las  pruebas  de  significance  para  los  coeficientes 
de  regresion  partial  se  pueden  efectuar  usando  la 
prueba  t  de  Student: 

,  bt  -  /3, 

t  = -  con  error  at  =  n  —  k  —  1 

SE  (bd 

5.  Los  intervalos  de  confianza  pueden  ser  generados 
por  computadora  para  estimar  el  valor  promedio 
de  y,  E(y),  para  valores  dados  de  xu  x2,  . . .,  xk. 

Los  intervalos  de  prediction  generados  por 
computadora  se  pueden  usar  para  predecir  una 
observation  particular  y  para  valores  determinados 


de  X|,  x2,  . . xk.  Para  xu  x2,  . . .,  xk,  los  intervalos  de 
prediction  determinados  son  siempre  mas  anchos 
que  los  intervalos  de  confianza. 

V.  Construccion  de  un  modelo 

1 .  El  numero  de  terminos  en  un  modelo  de  regresion 
no  puede  exceder  al  numero  de  observaciones  del 
conjunto  de  datos  y  debe  ser  considerablemente 
menor. 

2.  Para  considerar  un  efecto  curvilineo  en  una 
variable  cuantitativa,  use  un  modelo  polinomial 
de  segundo  orden.  Para  un  efecto  cubico,  use  un 
modelo  polinomial  de  tercer  orden. 

3.  Para  agregar  una  variable  cualitativa  con  k 
categories,  use  (k  —  1)  variables  ficticias  o 
indie  adoras. 

4.  Puede  haber  interacciones  entre  dos  variables 
cuantitativas  o  entre  una  variable  cuantitativa  y 
una  cualitativa.  Los  terminos  de  interaction  se 
introducen  como  /3 xj,. 

5.  Compare  modelos  usando /?2(adj). 


Procedimientos  de  regresion  multiple 


En  el  capftulo  12  usamos  los  procedimientos  de  regresion  lineal  disponibles  en  MINITAB 
para  efectuar  estimation  y  probar  un  analisis  de  regresion  lineal  simple .  Obt  uvimos  una  gra- 
fica  de  la  recta  de  mejor  ajuste  de  regresion  de  mfnimos  cuadrados  y  calculamos  el  co- 
eficiente  de  correlation  r  y  el  coeficiente  de  determination  r2.  Las  tecnicas  de  prueba  y 
estimation  para  un  analisis  de  regresion  multiple  tambien  estan  disponibles  con  MINITAB 
y  contienencasi  el  mismoconjunto  de  comandos.  Se  podrfarevisar  la  section  “Mi  MINITAB ” 
al  final  del  capftulo  12  antes  de  continuar  con  esta  section. 

Para  una  variable  de  respuesta  y  que  esta  relacionada  con  diversas  variables  predic- 
toras  xh  x2,  ...,  xk,  los  valores  observados  de  y  y  cada  una  de  las  variables  predictoras 
k  deben  introducirse  en  las  primeras  (k  +  I )  columnas  de  la  hoja  de  trabajo  MINITAB. 
Una  vez  hecho  esto,  las  principals  herramientas  inferenciales  para  analisis  de  regresion 
lineal  se  generan  usando  Stat  — >  Regression  — >  Regression.  El  cuadro  de  dialogo  para 
el  comando  Regression  se  muestra  en  la  figura  13.21. 

Seleccione  y  para  la  variable  de  respuesta  y  xk,x2,  ••-,xk  para  las  variables  predictoras. 
Ahora  se  puede  escoger  generar  algunas  graficas  residuales  para  comprobar  la  validez 
de  las  suposiciones  de  regresion  antes  de  usar  el  modelo  para  estimation  o  prediction. 
Escoja  Graphs  para  exhibir  el  cuadro  de  dialogo  para  graficas  residuales  y  escoja  la 
grafica  apropiada  de  diagnostico. 

Una  vez  que  haya  verificado  lo  apropiado  del  modelo  de  regresion  multiple,  puede  esco¬ 
ger  Options  y  obtener  intervalos  de  confianza  y  prediction  para  cualquiera  de  estos  casos: 

•  Un  solo  conjunto  de  valores  x,,  x2,  xk  (tecleados  en  el  cuadro  marcado  “Pre¬ 
diction  Intervals  for  new  observations”) 

•  Varios  conjuntos  de  valores  xh  x2,  . . .,  xk  guardados  en  k  columnas  de  la  hoja  de 
trabajo 

Cuando  haga  clic  en  OK  dos  veces,  se  genera  la  salida  de  regresion. 
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FIGURA  1 


3.21 


La  unica  dificultad  para  efectuar  el  analisis  de  regresion  multiple  usando  MINITAB 
podria  ser  introducir  correctamente  los  datos  para  su  modelo  particular.  Si  el  mode- 
lo  contiene  terminos  con  polinomios  o  terminos  de  interaction,  el  comando  Calc  —> 
Calculator  le  ayudara.  Por  ejemplo,  suponga  que  desea  ajustar  el  modelo 

E(y)  =  jS0  +  (i\Xx  +  p2x2  +  fS2x\  +  jS4XiX2 

Necesitara  introducir  los  valores  observados  de  y,  x,  y  x2  en  las  primeras  tres  columnas 
de  la  hoja  de  trabajo  MINITAB.  Aplique  nombre  a  la  columna  C4  “xl-sq”  y  a  C5  “xlx2”. 
Ahora  puede  usar  el  cuadro  de  dialogo  de  calculadora  que  se  ve  en  la  figura  13.22  para 
generar  estas  dos  columnas.  En  el  cuadro  Expression,  seleccione  xl  xl  o  xl  2  y  guarde 
los  resultados  en  C4  (xl-sq).  De  un  clic  en  OK.  Del  mismo  modo,  para  obtener  los  da¬ 
tos  para  C5,  seleccione  xl  x2  y  guarde  los  resultados  en  C5  (xlx2).  De  un  clic  en  OK. 
Ahora  esta  listo  para  efectuar  el  analisis  de  regresion  multiple. 

Si  usted  esta  ajustando  ya  sea  un  modelo  cuadratico  o  uno  cubico  en  una  variable  x, 
puede  ahora  graficar  los  puntos  de  datos,  la  curva  de  regresion  polinomial  y  los  limites 
de  confianza  y  prediction  superiores  e  inferiores  usando  Stat  — >  Regression  —>  Fit¬ 
ted  line  Plot.  Seleccione  y  y  x  para  las  variables  Response  y  Predictor,  y  de  un  clic  en 
“Display  confidence  interval”  y  “Display  prediction  interval”  en  el  cuadro  de  dialogo 
Options.  Asegurese  que  Quadratic  o  Cubic  este  seleccionado  como  el  “Type  of  Re¬ 
gression  Model”,  de  modo  que  obtenga  el  ajuste  apropiado  a  los  datos. 

Recuerde  que,  en  el  capitulo  12,  utilizo  Stat  — »  Basic  Statistics  —*  Correlation 
para  obtener  el  valor  del  coeficiente  de  correlacion  r.  En  analisis  de  regresion  mul¬ 
tiple,  el  mismo  comando  va  a  generar  una  matriz  de  correlaciones,  una  por  cada  par 
de  variables  del  conjunto  y,  xu  x2,  ...,  xk.  Asegurese  que  el  cuadro  marcado  “Display 
p-values”  se  haya  seleccionado  con  una  “paloma”.  Los  valores  p  daran  information 
sobre  la  correlacion  significativa  entre  un  par  particular,  en  presencia  de  todas  las  obras 
variables  del  modelo  y  sean  identicas  para  las  pruebas  t  individuales  de  los  coeficientes 
de  regresion. 
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FIGURA  1  3.22 


EJercicios  suplementarios 

(^)datos  13.25  Ingesta  de  Biotina  en  polios  Grupos 
de  polios  de  10  dias  de  edad  se  asignaron  al 
azar  a  siete  grupos  de  tratamiento  en  los  que  una  dieta 
basal  se  suplemento  con  0,  50,  100,  150,  200,  250  o  300 
microgramos/kilogramo  (/xg/kg)  de  biotina.  La  tabla 
siguiente  da  el  promedio  de  ingesta  de  biotina  (x) 
en  microgramos  por  dia  y  el  promedio  de  aumento 
de  peso  (y )  en  gramos  por  dia.6 


Biotin  agregado 

Ingesta  de  biotina,  x 

Aumento  de  peso,  y 

0 

.14 

8.0 

50 

2.01 

17.1 

100 

6.06 

22.3 

150 

6.34 

24.4 

200 

7.15 

26.5 

250 

9.65 

23.4 

300 

12.50 

23.3 

En  la  salida  impresa  MINITAB,  el  modelo  polinomial  de 
segundo  orden 


E(y')  =  p0  +  /3,x  +  /32x2 

esta  ajustado  a  los  datos.  Use  la  salida  impresa  para 

contestar  las  preguntas. 

a.  (\CuaI  es  la  recta  de  mmimos  cuadrados  ajustada? 

b.  Encuentre  R 2  e  interprete  su  valor. 

c.  (',Los  datos  dan  suficiente  evidencia  para  concluir 
que  el  modelo  aporta  informacion  significativa  para 
predecir  yl 

d.  Encuentre  los  resultados  de  la  prueba  de  H0  :  /32  =  0. 
^Hay  suficiente  evidencia  para  indicar  que  el  modelo 
cuadratico  da  un  mejor  ajuste  a  los  datos  que  un 
modelo  lineal  simple? 

e.  (.Las  graficas  residuales  indican  que  cualquiera  de 
las  suposiciones  de  regresion  han  sido  violadas? 
Explique. 
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Salida  impresa  MINITABpara  el  ejercicio  13.25 


Analisis  de  regresion:  y  contra  x.  x-sq 


The  regression  equation  is 
y  =  8.59  +  3.82  x  -  0.217  x-sq 


Predictor 


Coef  SE  Coef 


Constant 

x 

x-sq 


8.585 
3 . 8208 
-0.21663 


1.641 
0 . 5683 
0 . 04390 


T  P 

5.23  0.006 

6.72  0.003 

-4.93  0.008 


S  =  1.83318  R-Sq  =  94.4% 


R-Sq(adj)  =  91.5% 


Analysis  of  Variance 


Source  DF 
Regression  2 
Residual  Error  4 
Total  6 


SS 

224.75 
13.44 
238 . 19 


MS  F  P 

112.37  33.44  0.003 

3 .36 


Source  DF 

x  1 

x-sq  1 


Seq  SS 
142 . 92 
81 . 83 


Residuales  contra  valores  ajustados 

(la  respuesta  es  y) 


10  12  14  16  18  20  22  24  26 

Valor  ajustado 


Crafica  normal  de  probabilidad  de  los  residuales 

(la  respuesta  es  y) 


:^)datos  13.26  Publicidad  y  ventas  Unatiendade 
departamentos  realizo  un  experimento  con  el 
fin  de  investigar  los  efectos  de  gastos  de  publicidad  en 
las  ventas  semanales  de  sus  departamentos  de  ropa  para 


Caballeros,  para  ninos  y  para  damas.  Cinco  semanas  de 
observacion  se  seleccionaron  al  azar  de  cada  depar- 
tamento  y  un  presupuesto  de  publicidad  X\  (en  cientos 
de  dolares)  se  asigno  a  cada  uno.  Las  ventas  semanales 
(en  miles  de  dolares)  se  muestran  en  la  tabla  siguiente 
para  cada  uno  de  los  1 5  periodos  de  venta  de  una 
semana.  Si  esperamos  que  las  ventas  semanales  E(y ) 
esten  linealmente  relacionadas  con  el  gasto  de  publicidad 
X\  y  si  esperamos  que  las  pendientes  de  las  rectas 
correspondientes  a  los  tres  departamentos  difieran, 
entonces  un  modelo  apropiado  para  E(y)  es 


filXl  +  @3X3  +  @4X3X2  +  ^5X3X3 


E(y)  =  /30  + 

@3X3  + 

variable 
cuantitativa 
“gasto  en 
publicidad” 


variables  ficticias 
usadas  para 
introducir  la 
variable  cualitativa 
“departamento” 
en  el  modelo 


terminos  de 
interaction  que 
introducen  diferencias 
en  pendientes 


donde 

X3  =  gasto  en  publicidad 


[  1  si  el  departamento  de  ropa  para  ninos  es  B 
[0  si  no  lo  es 


[l  si  el  departamento  de  ropa  para  damas  es  C 
[0  si  no  lo  es 


Gasto  en  publicidad 
(cientos  de  dolares) 


Departamento 

1 

2 

3 

4 

5 

Ropa  para  Caballeros  A 

$5.2 

$5.9 

$7.7 

$7.9 

$9.4 

Ropa  para  ninos  B 

8.2 

9.0 

9.1 

10.5 

10.5 

Ropa  para  damas  C 

10.0 

10.3 

12.1 

12.7 

13.6 

a.  Encuentre  la  ecuacion  de  la  recta  que  relacione  E(y) 
con  el  gasto  en  publicidad  x,  para  el  departamento  A 
de  ropa  para  Caballeros,  [sugerencia:  De  acuerdo  con 
el  codigo  usado  para  las  variables  ficticias,  el  modelo 
representa  ventas  medias  E(y)  para  el  departamento  A 
de  ropa  para  Caballeros  cuando  x2  =  x3  =  0.  Sustituya 
x2  =  X3  =  0  en  la  ecuacion  para  E(y)  para  hallar  la 
ecuacion  de  esta  recta.] 

b.  Encuentre  la  ecuacion  de  la  recta  que  relacione  E(y) 
con  X3  para  el  departamento  B  de  ropa  para  ninos. 
[sugerencia:  De  acuerdo  con  el  codigo,  el  modelo 
representa  E(y)  para  el  departamento  de  ropa  para 
ninos  cuando  x2  =  1  y  x3  =  0.] 
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c.  Encuentre  la  ecuacion  para  la  recta  que  relacione  E(y) 
con  x,  para  el  departamento  C  de  ropa  para  mujeres. 

d.  Encuentre  la  diferencia  entre  los  puntos  de 
intersection  de  las  rectas  E(y)  correspondientes  a  los 
departamentos  B  de  ropa  para  ninos  y  A  de  ropa  para 
Caballeros. 

e.  Encuentre  la  diferencia  de  pendientes  entre  las  rectas 
E(y )  correspondientes  a  los  departamentos  C  de  ropa 
para  mujeres  y  A  de  ropa  para  Caballeros. 

f.  Consulte  el  inciso  e).  Suponga  que  se  desea  probar 
la  hipotesis  nula  de  que  las  pendientes  de  las  rectas 
correspondientes  a  los  tres  departamentos  son  iguales. 
Expresa  esto  como  una  prueba  de  hipotesis  acerca  de 
uno  o  mas  parametros  de  modelo. 

13.27  Publicidad  y  ventas,  continua  Consulte 
el  ejercicio  13.26.  Use  un  paquete  de  software  de 
computadora  para  efectuar  el  analisis  de  regresion 
multiple  y  obtener  graficas  de  diagnostico  si  es  posible. 

a.  Comente  sobre  el  ajuste  del  modelo,  usando  el 
analisis  de  varianza  de  prueba  F,  R2  y  las  graficas 
de  diagnostico  para  comprobar  las  suposiciones  de 
regresion. 

b.  Encuentre  la  ecuacion  de  prediccion  y  grafique  las 
rectas  de  ventas  de  los  tres  departamentos. 

c.  Examine  las  graficas  del  inciso  b).  ^Parecen  diferir 
las  pendientes  de  las  rectas  correspondientes  a  los 
departamentos  B  de  ropa  para  ninos  y  A  de  ropa 
para  Caballeros?  Pruebe  la  hipotesis  nula  de  que  las 
pendientes  no  difieren  ( H0 :  /34  =  0)  contra  la  hipotesis 
alternativa  de  que  las  pendientes  son  diferentes. 

d.  ^Los  terminos  de  interaccion  del  modelo  son 
significativos?  Use  los  metodos  descritos  en  la  section 
13.5  para  probar  H0  :  /34  =  /35  =  0.  <',Los  resultados  de 
esta  prueba  sugieren  que  el  modelo  ajustado  debe  ser 
modificado? 

e.  Escriba  una  explication  breve  de  las  implicaciones 
practicas  de  este  analisis  de  regresion. 

(^)datos  13.28  Demands  de  servicio  electrico  Las 

compafuas  de  servicio  electrico,  que  deben 
planear  la  operation  y  expansion  de  generacion  de 
electricidad,  estan  vitalmente  interesadas  en  predecir  la 
demanda  de  consumidores  tanto  a  corto  como  a  largo 
plazos.  Un  estudio  a  corto  plazo  se  realizo  para  investigar 
el  efecto  de  la  temperatura  diaria  mensual  jq  y  el  costo 
por  kilowatt-hora  x2  en  el  consumo  diario  medio  (en 
kilowatt-horas,  kWh)  por  familia.  La  companfa  esperaba 
que  la  demanda  de  electricidad  subiera  en  tiempo 
frfo  (debido  a  calefaccion),  bajara  cuando  el  clima  fuera 
moderado  y  subiera  de  nuevo  cuando  la  temperatura 
subiera  y  hubiera  necesidad  de  poner  a  funcionar  el  aire 


acondicionado.  Esperaban  que  la  demanda  disminuyera 
a  medida  que  aumentara  el  costo  por  kilowatt-hora,  lo 
que  refleja  mayor  atencion  a  la  conservation.  Los  datos 
estuvieron  disponibles  para  2  anos,  un  periodo  en  el  que 
el  costo  por  kilowatt-hora  x2  aumento  debido  al  creciente 
costo  del  combustible.  La  companfa  ajusto  el  modelo 

E(y)  =  /So  +  /3 1*1  +  (i2x\  +  (32x2  +  fi^CiX2  +  fi&W 

a  los  datos  que  se  ven  en  la  tabla  siguiente.  La  salida 
impresa  MINITAB  para  este  problema  de  regresion 
multiple  tambien  se  ilustra. 


Precio  por 

Temperatura  diaria 

Consumo  diario  medio 

kWh,  x2 

y  consumo 

(kWh)  por  familia 

CO 

-€=5- 

Temperatura  diaria 

31 

34 

39 

42 

47 

56 

media  (°F),  x, 

62 

66 

68 

71 

75 

78 

Consumo  diario 

55 

49 

46 

47 

40 

43 

medio,  y 

41 

46 

44 

51 

62 

73 

100 

Temperatura  diaria 

32 

36 

39 

42 

48 

56 

media,  x j 

62 

66 

68 

72 

75 

79 

Consumo  diario 

50 

44 

42 

42 

38 

40 

medio,  y 

39 

44 

40 

44 

50 

55 

Salida  impresa  MINITAB  para  el  ejercicio  13.28 


Analisis  de  regresion:  y  contra  xl,  xl-sq,  x2,  x1x2,  x1sqx2 

The  regression  equation  is 
y  =  326  -  11.4  xl  +  0.113  xl-sq  -  21.7  x2 
+  0.873  xlx2  -  0.00887  xlsqx2 


Predictor 

Constant 

xl 

xl-sq 

x2 

xlx2 

xlsqx2 


Coef 
325.61 
-11.383 
0.11350 
-21.699 
0 . 8730 
-0 . 008869 


SE  Coef 
83 . 06 
3.239 
0.02945 
9.224 
0.3589 


T  P 

3.92  0.001 

-3.51  0.002 

3.85  0.001 

-2.35  0.030 

2.43  0.026 

-2.72  0.014 


S  =  2.90763 


R-Sq  =  89.8% 


R-Sq(adj)  =  87.0% 


Analysis  of  Variance 


Source  DF 
Regression  5 
Residual  Error  18 
Total  23 


SS 

1346.45 

152.18 

1498.63 


MS  F 

269.29  31.85 

8.45 


Source  DF 

xl  1 

xl-sq  1 

x2  1 

xlx2  1 

xlsqx2  1 


Seq  SS 
140 . 71 
892 . 78 
192.44 
57.84 
62 . 68 


Unusual  Observations 
Obs  xl  y  Fit 

9  68.0  44.000  49.640 

12  78.0  73.000  67.767 


SE  Fit  Residual  St  Resid 
1.104  -5.640  -2.10R 

2.012  5.233  2.49R 


R  denotes  an  observation  with  a  large  standardized  residual. 


a.  <',Los  datos  dan  suficiente  evidencia  para  indicar  que 
el  modelo  aporta  information  para  la  prediccion  del 
consumo  diario  medio  en  kilowatt-hora  por  familia? 
Pruebe  al  nivel  de  significancia  de  5%. 

b.  Grafique  la  curva  que  describe  y  como  funcion  de  la 
temperatura  xi  cuando  el  costo  por  kilowatt-hora  es 
x2  =  80.  Construya  una  grafica  similar  para  el  caso 
cuando  x2  =  100  por  kilowatt-hora.  (.Son  diferentes 
las  curvas  de  consumo? 
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c.  Si  el  costo  por  kilowatt-hora  no  es  importante  para 
predecir  el  uso,  entonces  en  el  modelo  no  se  necesitan 
los  terminos  que  contienen  x2.  Por  tanto,  la  hipotesis 
nula 

H0 :  x2  no  aporta  information  para  la  prediction 
de  y 


X|  =  Edad  del  delfrn  (en  anos) 

0  si  hembra 

X2  = 

1  si  macho 

y  =  Concentration  de  mercurio 

(en  microgramos/gramo)  en  el  hfgado 


es  equivalente  a  la  hipotesis  nula  H0 :  (33  =  j84  = 
j85  =  0  (si  /3  s  =  jS4  =  j85  =  0,  los  terminos  que 
contienen  x2  desaparecen  del  modelo).  La  salida 
impresa  MINITAB ,  obtenida  al  ajustar  el  modelo 
reducido 

E(y)  =  /S0  +  fiix,  +  f32x\ 

a  los  datos,  se  muestra  aquf.  Use  los  metodos  de  la 
section  13.5  para  determinar  si  el  precio  por  kilowatt- 
hora  x2  aporta  informacion  significativa  para  la 
prediccion  de  y. 


Salida  impresa  MINITAB  para  el  ejercicio  13.28 


Analisis  de  regresion:  y  contra  xl,  xl-sq 


The  regression  equation  is 
y  =  130  -  3.50  xl  +  0.0334  xl-sq 


Predictor 

Constant 

xl 

xl-sq 


Coef 

130.01 

-3.5017 

0.033371 


SE  Coef 
14 . 88 
0.5789 
0.005256 


T  P 
8.74  0.000 
6.05  0.000 
6.35  0.000 


S  =  4.70630  R-Sq  =  69.0% 


R-Sq(adj)  =  66.0% 


Analysis  of  Variance 


Source  DF 
Regression  2 
Residual  Error  21 
Total  23 


SS 

1033.49 
465 . 13 
1498.63 


MS  F  P 

516.75  23.33  0.000 

22.15 


Source  DF 

xl  1 

xl-sq  1 


Seq  SS 
140.71 
892.78 


Unusual  Observations 
Obs  xl  y  Fit 

12  78.0  73.000  59.906 


SE  Fit  Residual  St  Resid 

2.243  13.094  3.16R 


R  denotes  an  observation  with  a  large  standardized  residual. 


d.  Compare  los  valores  de  R2(adj)  para  el  ajuste  de  los 
dos  modelos.  (jCuaI  de  los  dos  modelos  recomendarfa 
usted? 

(^)datos  13.29  Concentration  de  mercurio  en 
delfines  Debido  a  que  los  delfines  (y  otros 
grandes  marm'feros  marinos)  son  considerados  como 
los  principales  depredadores  en  la  cadena  alimenticia 
marina,  las  concentraciones  de  metales  pesados  en  del- 
fines  de  franjas  se  midieron  como  parte  de  un  estudio  de 
contamination  marina.  Se  espera  que  la  concentration 
de  mercurio,  el  metal  pesado  reportado  en  este  estudio, 
difiera  en  machos  y  hembras  porque  el  mercurio  en  una 
hembra  aparentemente  es  pasado  a  su  descendencia 
durante  la  gestation  y  lactancia.  Este  estudio  comprendio 
28  machos  entre  las  edades  de  .21  y  39.5  anos  y  17 
hembras  de  edades  entre  .80  y  34.5  anos.  Para  los  datos 
de  la  tabla. 


V 

Xi 

Xl 

y 

Xi 

Xi 

170 

.21 

1 

481.00 

22.50 

1 

172 

.33 

1 

485.00 

24.50 

1 

8.80 

2.00 

1 

221.00 

24.50 

1 

5.90 

2.20 

1 

406.00 

25.50 

1 

101.00 

8.50 

1 

252.00 

26.50 

1 

85.40 

11.50 

1 

329.00 

26.50 

1 

118.00 

11.50 

1 

316.00 

26.50 

1 

183.00 

13.50 

1 

445.00 

26.50 

1 

168.00 

16.50 

1 

278.00 

27.50 

1 

218.00 

16.50 

1 

286.00 

28.50 

1 

180.00 

264.00 

17.50 

20.50 

1 

1 

315.00 

29.50 

1 

V 

Xi 

Xl 

y 

Xi 

Xl 

241.00 

31.50 

1 

142.00 

17.50 

0 

397.00 

31.50 

1 

180.00 

17.50 

0 

209.00 

36.50 

1 

174.00 

18.50 

0 

314.00 

37.50 

1 

247.00 

19.50 

0 

318.00 

39.50 

1 

223.00 

21.50 

0 

2.50 

.80 

0 

167.00 

21.50 

0 

9.35 

1.58 

0 

157.00 

25.50 

0 

4.01 

1.75 

0 

177.00 

25.50 

0 

29.80 

5.50 

0 

475.00 

32.50 

0 

45.30 

7.50 

0 

342.00 

34.50 

0 

101.00 

8.05 

0 

135.00 

11.50 

0 

a.  Escriba  un  modelo  de  segundo  orden  que  relatione  y 
con  Xi  y  x2.  Considere  curvatura  en  la  relation  entre 
edad  y  concentration  de  mercurio,  asf  como  para  una 
interaction  entre  genero  y  edad. 

Use  un  software  de  computadora  para  efectuar  el  analisis 
de  regresion  multiple.  Consulte  la  salida  impresa  para 
contestar  estas  preguntas. 

b.  Comente  sobre  el  ajuste  del  modelo,  usando 
estadfsticas  relevantes  de  la  salida  impresa. 

c.  (',Cual  es  la  ecuacion  de  prediction  para  predecir  la 
concentration  de  mercurio  en  un  delfrn  hembra  como 
funcion  de  su  edad? 

d.  ^Cual  es  la  ecuacion  de  prediccion  para  predecir  la 
concentration  de  mercurio  en  un  delfrn  macho  como 
funcion  de  su  edad? 

e.  7,  El  termino  cuadratico  de  la  ecuacion  de  prediccion 
para  hembras  hace  aportacion  significativa  a  la 
prediccion  de  la  concentration  de  mercurio  en  un 
delfrn  hembra? 
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f.  7,  Hay  otras  conclusiones  importantes  que  usted  sienta 
que  no  se  consideraron  respecto  a  la  ecuacion  de 
prediccion  ajustada? 

datos  13.30  El  costo  de  volar  7EI  costo  de  un 

vuelo  en  avion  depende  de  la  aerolfnea  y  de  la 
distancia  recorrida?  En  el  ejercicio  12.21,  exploramos 
la  primera  parte  de  este  problema.  Los  datos  mostra- 
dos  en  esta  tabla  comparan  el  costo  promedio  y  distancia 
recorrida  para  dos  lmeas  aereas  diferentes,  medidas  para 
1 1  rutas  aereas  de  gran  movimiento  en  Estados  Unidos.7 


Ruta 

Distancia 

Costo 

Aerolinea 

Chicago-Detroit 

238 

148 

American 

164 

United 

Chicago-Denver 

901 

256 

American 

312 

United 

Chicago-St.  Louis 

262 

136 

American 

152 

United 

Chicago-Seattie 

1736 

424 

American 

520 

United 

Chicago-Cleveland 

301 

129 

American 

139 

United 

Los  Angeles-Chicago 

1757 

361 

American 

473 

United 

Chicago-Atlanta 

593 

162 

American 

183 

United 

Nueva  York-Los  Angeles 

2463 

444 

American 

525 

United 

Nueva  York-Chicago 

714 

287 

American 

334 

United 

Los  Angeles-Honolulu 

2556 

323 

American 

333 

United 

Nueva  York-San  Francisco 

2574 

513 

American 

672 

United 

Use  un  paquete  de  computadora  para  analizar  los 
datos  con  un  analisis  de  regresion  multiple.  Comente 
sobre  el  ajuste  del  modelo,  las  variables  significativas, 
cualesquiera  interacciones  que  existan  y  suposiciones 
de  regresion  que  puedan  haber  sido  violadas.  Resuma 
sus  resultados  en  un  informe,  incluyendo  salidas 
impresas  y  graficas  si  posible. 

(($£)) datos  13.31  En  camino  otra  vez  Hasta  fechas 
recientes,  las  llantas  de  alto  rendimiento  se 
ajustaban  principalmente  en  vehiculos  deportivos  o  de 
lujo.  Ahora  se  han  convertido  en  estandar  en  muchos 
sedanes  de  uso  diario.  Los  mayores  niveles  de  manejo  y 
agarre  al  pavimento  han  aparecido  a  expensas  del  desgaste 
en  el  dibujo  o  superficie  de  rodamiento.  Los  datos  que 
siguen  se  han  resumido  de  un  informe,  sobre  llantas 
de  alto  rendimiento  de  clasificacidn  H  por  Consumer 
Reports 8,  en  el  que  se  evaluaron  varios  aspectos  del 
rendimiento  para  n  =  22  llantas  diferentes  y  fueron: 

y  =  puntuacion  general  x,  =  frenado  en  seco 

x2  =  frenado  en  humedo  x3  =  manejo 

x4  =  resistencia  al  rodamiento  xs  =  duracion  del  dibujo 


Lianta 

Costo 

y 

X 

*2 

*3 

*4 

x5 

Dunlop®  SP  Sport  5000 

81 

85 

5 

5 

4 

4 

4 

Michelin®  Pilot  Exalto  A/S 

78 

83 

5 

5 

4 

3 

4 

Falken®  Ziex  ZE512 

56 

83 

5 

5 

4 

3 

2 

Continental®  ContiProContact 

77 

81 

4 

5 

4 

4 

2 

Michelin  Pilot  XGTH4 

98 

81 

5 

5 

4 

1 

2 

Bridgestone®  Potenza  RE  950 

80 

80 

5 

5 

4 

2 

2 

BFGoodrich®  Traction  T/A 

68 

78 

5 

5 

4 

2 

3 

Yokohama®  Avid  H4s 

62 

77 

5 

5 

4 

3 

4 

Sumitomo®  HTR  H4 

56 

76 

5 

5 

3 

2 

1 

Bridgestone  HP50 

79 

75 

4 

5 

4 

2 

1 

Michelin  Energy  MXV4  Plus 

103 

73 

3 

4 

4 

5 

5 

Goodyear®  Assurance  Triple  Tred 

85 

72 

3 

4 

3 

3 

5 

Kumho  Solus  KH16 

49 

72 

4 

4 

4 

3 

5 

Pirelli®  P6  Four  Seasons 

71 

70 

3 

4 

3 

2 

2 

Bridgestone  Potenza  G009 

62 

70 

4 

4 

4 

2 

2 

Dayton®  Daytona  FIR 

46 

69 

4 

4 

3 

2 

2 

Fuzion®  HRi 

49 

69 

4 

4 

4 

1 

2 

Continental  ContiPremierContact 

91 

68 

3 

4 

4 

5 

5 

Cooper®  Lifeliner  Touring  SLE 

61 

65 

3 

3 

3 

2 

2 

Bridgestone  Turanza  EL400 

91 

63 

3 

3 

4 

2 

2 

Flankook®  Optimo  H418 

51 

62 

3 

2 

3 

3 

4 

General  Exclaim 

53 

50 

2 

2 

3 

2 

2 

Las  variables  xt  a  la  xs  estan  codificadas  usando  la  escala 
de  5  =  excelente,  4  =  muy  buena,  3  =  buena,  2  =  regular 
y  1  =  mala. 

a.  Use  un  programa  de  su  eleccion  para  hallar  la  matriz 
de  correlation  para  las  variables  bajo  estudio,  que 
incluya  costo.  7  El  costo  esta  significativamente 
correlacionado  con  cualquiera  de  las  variables  de 
estudio?  yCuales  variables  parecen  estar  altamente 
correlacionadas  con  y,  la  puntuacion  total? 

b.  Escriba  un  modelo  para  describir  y,  la  puntuacion 
total,  como  funcion  de  las  variables  x3  =  frenado  en 
seco,  x2  =  frenado  en  humedo,  x3  =  manejo,  x4  = 
resistencia  al  rodamiento  y  x5  =  duracion  del  dibujo. 

c.  Use  un  programa  de  regresion  de  su  eleccion  para 
ajustar  el  modelo  completo  usando  todas  las  variables 
predictoras.  ^Que  proporcion  de  la  variacion  en  y  esta 
explicada  por  regresion?  yEsto  comunica  la  impresion 
de  que  el  modelo  explica  en  forma  adecuada  la 
variabilidad  inherente  en  y? 

d.  yCiial  variable  o  variables  parecen  ser  buenas 
variables  predictoras  de  y?  yComo  podrfa  refinarse 
el  modelo  en  vista  de  estos  resultados?  Use  estas 
variables  para  reajustar  el  modelo.  7  Que  proporcion  de 
la  variacion  es  explicada  por  este  modelo  reajustado? 
Comente  sobre  lo  adecuado  de  este  modelo  reducido 
en  comparacion  con  el  modelo  completo. 

datos  13.32  Atunes  Los  datos  sobre  atunes  del 
ejercicio  1 1 . 16  se  analizaron  como  un  diseno 
completamente  aleatorizado  con  cuatro  tratamientos. 

No  obstante,  tambien  podrfamos  ver  el  diseno 
experimental  como  un  experimento  factorial  de  2  X  2 
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con  repeticiones  desiguales.  Los  datos  se  muestran 
a  continuation.9 


Aceite 

Agua 

Atun  claro 

2.56 

.62 

.99 

1.12 

1.92 

.66 

1.92 

.63 

1.30 

.62 

1.23 

.67 

1.79 

.65 

.85 

.69 

1.23 

.60 

.65 

.60 

.67 

.53 

.60 

1.41 

.66 

Atun  bianco 

1.27 

1.49 

1.29 

1.22 

1.29 

1.00 

1.19 

1.27 

1.27 

1.22 

1.35 

1.28 

Fuente:  Estudio  practico  "Tuna  Goes  Upscale"  Copyright  2001  por  Consumers  Union  of  U.S. 
Inc.,  Yonkers,  NY  10703-1057,  organization  sin  fines  de  lucro.  Reimpreso  con  permiso  de  la 
edition  de  junio  de  2001  de  Consumer  Reports®  solo  para  fines  educativos.  No  se  permite 
uso  comercial  ni  reproduction.  www.ConsumerReports.org 

Los  datos  se  pueden  analizar  usando  el  modelo 

y  =  /So  +  fiiXx  +  fi2x2  +  fi&fa  +  e 

donde 

Xi  =  0  si  en  aceite,  1  si  en  agua 
x2  =  0  si  atun  claro,  1  si  atun  bianco 


13.33  Atun,  continua  Consulte  el  ejercicio  13.32. 

La  hipotesis  probada  en  el  capitulo  1 1 ,  que  el  promedio 
de  precios  para  los  cuatro  tipos  de  atun  es  igual,  es 
equivalente  a  decir  que  E(y )  no  cambiara  cuando  x,  y  x2 
cambien.  Esto  puede  ocurrir  solo  cuando  /Si  =  fi2  = 
fi3  =  0.  Use  la  salida  impresa  MINITAB  para  la  ANOVA 
de  una  via  que  se  muestra  a  continuacion  para  efectuar  la 
prueba  de  igualdad  de  medias  de  tratamiento.  Verifique 
que  esta  prueba  sea  identica  a  la  prueba  para  regresion 
significativa  del  ejercicio  13.32. 

Salida  impresa  MINITAB  para  el  ejercicio  13.33 

ANOVA  de  una  via:  claro  en  agua,  bianco  en  aceite, 
bianco  en  agua,  claro  en  aceite 


Source 

Factor 

Error 

Total 

DF  SS 

3  0.922 

33  6.810 

36  7.733 

MS 

0.307 

0.206 

F 

1.49 

P 

0.235 

S  =  0.4543 

R-Sq  =  11.93% 

R- 

Sq(adj)  = 

3 . 92% 

datos  13.34  Control  de  calidad  Unfabricante 
registro  el  numero  de  piezas  defectuosas  (v) 
producidas  en  un  dia  determinado  por  cada  uno  de  10 
operadores  de  maquinas  y  tambien  registro  la  production 
promedio  por  hora  (x,)  por  cada  operador  y  el  tiempo  en 
semanas  desde  el  ultimo  servicio  a  una  maquina  (x2). 


a.  Demuestre  como  introduciria  los  datos  en  una  hoja  de 
trabajo  de  computadora,  introduciendo  los  datos  en  las 
columnas  para  y,  x,,  x2  y  x,x2. 

b.  La  salida  impresa  generada  por  MINITAB  se  muestra 
a  continuacion.  /  Cual  es  la  ecuacion  de  prediccion 
de  mmimos  cuadrados? 

Salida  impresa  MINITAB  para  el  ejercicio  13.32 

Analisis  de  regresion:  y  contra  xl,  x2,  x1x2 

The  regression  equation  is 

y  =  1.15  -  0.251  xl  +  0.078  x2  +  0.306  xlx2 


Predictor 

Coef 

SE  Coef 

T 

P 

Constant 

1.1473 

0.1370 

8.38 

0 . 000 

xl 

0.2508 

0.1830 

-1.37 

0 . 180 

x2 

0 . 0777 

0.2652 

0.29 

0.771 

xlx2 

0.3058 

0.3330 

0 . 92 

0.365 

S  =  0.454287 

R-Sq 

=  11.9% 

R-Sq ( ad j)  = 

3.9% 

Analysis  of  Variance 

Source 

DF 

SS 

MS  F 

P 

Regression 

3 

0.9223  0. 

.3074  1.49 

0.235 

Residual  Error 

33 

6.8104  0. 

.2064 

Total 

36 

7 . 7328 

c.  pHay  interaccion  entre  el  tipo  de  atun  y  el  tipo  de 
liquido  de  empaque? 

d.  /.Cual,  si  lo  hay,  de  los  principales  efectos  (tipo  de 
atun  y  tipo  de  liquido  de  empaque)  aporta  informacion 
significativa  para  la  prediccion  de  yl 

e.  /.Que  tan  bien  se  ajusta  el  modelo  a  los  datos? 
Explique. 


V 

Xl 

*2 

13 

20 

3.0 

1 

15 

2.0 

11 

23 

1.5 

2 

10 

4.0 

20 

30 

1.0 

15 

21 

3.5 

27 

38 

0 

5 

18 

2.0 

26 

24 

5.0 

1 

16 

1.5 

La  salida  impresas  que  sigue  resulto  cuando  estos  datos 
se  analizaron  usando  el  paquete  MINITAB  usando  el 
modelo: 

E(y)  =  fin  +  fi\X\  +  fi2x2 


Analisis  de  regresion:  y  contra  xl,  x2 

The  regression  equation  is 
y  =  -28.4  +  1.46  xl  +  3.84  x2 


Predictor 

Coef 

SE  Coef 

T  P 

Constant 

-28.3906 

0 . 8273 

-34.32  0.000 

xl 

1.46306 

0 . 02699 

-54.20  0.000 

x2 

3 . 8446 

0.1426 

26.97  0.000 

S  =  0.548433 

R-Sq 

=  99.8% 

R-Sq(adj)  =  99.7% 

Analysis  of 

Variance 

Source 

DF 

SS 

MS  F 

Regression 

2 

884.79  442 

.40  1470.84  0.01 

Residual  Error  7 

2.11  0 

.30 

Total 

9 

886 . 90 

Source  DF 

Seq  SS 

xl  1 

666 . 04 

x2  1 

218 . 76 
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a.  Interprete  R2  y  comente  sobre  el  ajuste  del  modelo. 

b.  7,  Hay  evidencia  para  indicar  que  el  modelo  contribuye 
de  manera  significativa  a  la  prediccion  de  y  al  nivel  de 
significancia  de  a  =  .01? 

c.  (',Cual  es  la  ecuacion  de  prediccion  que  relacione  y 
y  cuando  x2  =  4? 

d.  Use  la  ecuacion  de  prediccion  ajustada  para 
predecir  el  numero  de  piezas  defectuosas  producidas 
por  un  operador  cuya  production  promedio  por  hora 
es  25,  cuya  maquina  ha  recibido  servicio  hace  tres 
semanas. 

e.  7,  Que  nos  dicen  las  graficas  residuales  acerca  de  la 
validez  de  las  suposiciones  de  regresion? 


(juntos  13.35  Corrosion  de  metal  y  acidos  del 

suelo  En  una  investigacion  para  determinar 
la  relation  entre  el  grado  de  corrosion  de  metal  y  el 
tiempo  que  el  metal  se  exponga  a  la  action  de  acidos  del 
suelo,  el  porcentaje  de  corrosion  y  tiempo  de  exposicion 
se  midieron  semanalmente. 


V 

0.1 

0.3 

0.5 

0.8 

1.2 

1.8 

2.5 

3.4 

X 

1 

2 

3 

4 

5 

6 

7 

8 

Los  datos  se  ajustaron  usando  el  modelo  cuadratico, 
E(y)  =  /30  +  fi\X  +  /32x2,  con  los  siguientes  resultados. 


Analisis  de  regresion:  y  contra  x,  x-sq 

The  regression  equation  is 
y  =  0.196  -  0.100  x  +  0.0619  x-sq 


Predictor 

Constant 

x 

x-sq2 


Coef 
0 . 19643 
-0.10000 
0 . 061905 


SE  Coef 
0 . 07395 
0 . 03770 
0 . 004089 


T  P 

2.66  0.045 

-2.65  0.045 

15.14  0.000 


S  =  0.0530049  R-Sq  =  99.9%  R-Sq(adj)  =  99.8% 


Analysis  of  Variance 

Source  DF  SS  MS  F  P 

Regression  2  9.4210  4.7105  1676.61  0.000 

Residual  Error  5  0.0140  0.0028 

Total  7  9.4350 


Source  DF  Seq  SS 
x  1  8.7771 
x-sq  1  0.6438 


a.  ^Que  porcentaje  de  la  variation  total  es  explicada  por 
la  regresion  cuadratica  de  y  en  x? 

b.  (',La regresion  enxyx2  es  significativa  al  nivel  de 
significancia  de  a  =  .05? 

c.  (',EI  coeficiente  de  regresion  lineal  es  significativo 
cuando  x2  esta  en  el  modelo? 

d.  (iEI  coeficiente  de  regresion  cuadratica  es  significativo 
cuando  x  esta  en  el  modelo? 

e.  Los  datos  se  ajustaron  a  un  modelo  lineal  sin  el 
termino  cuadratico  con  los  resultados  que  siguen. 

(iQue'  se  puede  decir  acerca  de  la  contribution  del 
termino  cuadratico  cuando  esta  incluido  en  el  modelo? 


Analisis  de  regresion:  y  contra  x 

The  regression  equation  is 
y  =  -0.732  +  0.457  x 

Predictor  Coef  SE  Coef  T  P 

Constant  -0.7321  0.2580  -2.84  0.030 

x  0.45714  0.05109  8.95  0.000 


S  =  0.331124  R-Sq  =  93.0% 


R-Sq(adj)  =  91.9% 


Analysis  of  Variance 

Source  DF  SS  MS  F  P 

Regression  1  8.7771  8.7771  80.05  0.000 

Residual  Error  6  0.6579  0.1096 

Total  7  9.4350 


f.  La  grafica  de  los  residuales  del  modelo  de  regre¬ 
sion  lineal  en  el  inciso  e)  muestra  un  modelo 
espetifico.  <:Cual  es  el  termino  del  modelo  que 
parece  estar  faltando? 
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Valores  residuales  contra  Ios  ajustados 

(la  respuesta  es  y) 

05  H  T" 

°-4- 

0.3- 
0.2- 
s  0.1- 

1  0.0 - - - 

-0.1- 

-0.2-  • 

-0.3-  • 

-°-4J - t - . - t - r~ - t - t - T- 

0.0  0.5  1.0  1.5  2.0  2.5  3.0 

Valor  ajustado 


datos  13.36  Vlanejando  su  dinero  Una 

corporacion  particular  de  ahorros  y  prestamos 
esta  interesada  en  determinar  que  tan  bien  se  puede 
predecir  la  cantidad  de  dinero  en  ahorros  familiares, 
usando  las  tres  variables  independientes  de  ingreso  anual, 
numero  de  personas  en  la  familia  y  area  en  la  que  viva  la 
familia.  Suponga  que  hay  dos  areas  especfficas  de  interes 
para  la  corporacion.  Se  recolectaron  los  datos  siguientes, 
donde 

y  =  Cantidad  en  todas  las  cuentas  de  ahorros 
Xi  =  Ingreso  anual 

x2  =  Numero  de  personas  en  la  familia 
x3  =  0  si  en  Area  1 ;  1  si  no 
Tanto  y  como  Xi  se  registraron  en  unidades  de  $1000. 


La  siguiente  salida  impresa  de  computadora  resulto 
cuando  los  datos  fueron  analizados  usando  MINITAB. 

Analisis  de  regresion:  y  contra  xi,  x2,  x3 

The  regression  equation  is 


y  =  -3.11 

+ 

0.503  xl 

-  1.61  x2 

-  1.15  x3 

Predictor 

Coef 

SE  Coef 

T  P 

Constant 

-3 . 112 

3 . 600 

-0.86  0.421 

xl 

0.50314 

0 . 07670 

6.56  0.001 

x2 

-1.6126 

0 . 6579 

-2.45  0.050 

x3 

-1.155 

1.791 

-0.64  0.543 

S  =  1.89646 

R-Sq  = 

92.2% 

R-Sq(adj)  =  88.' 

Analysis 

of 

Variance 

Source 

DF 

SS 

MS  F 

Regression 

3 

256 . 621 

85.540  23.78  i 

Residual 

Error  6 

21.579 

3.597 

Total 

9 

278.200 

Source 

DF 

Seq  SS 

xl 

1 

229 . 113 

x2 

1 

26 . 012 

x3 

1 

1.496 

a.  Interprete  R2  y  comente  sobre  el  ajuste  del  modelo. 

b.  Pruebe  para  una  regresion  significativa  de  y  en  xt,  x2 
y  x3  al  nivel  de  significancia  de  5%. 

c.  Pruebe  la  hipotesis  Hn :  /L  =  0  contra  H.d :  /3,  A1  0 
usando  a  =  .05.  Comente  sobre  los  resultados  de  su 
prueba. 

d.  ('  Que  se  puede  decir  de  la  utilidad  de  jc3  como  variable 
de  prediccion  en  este  problema? 


y 

x, 

Xi 

*3 

0.5 

19.2 

3 

0 

0.3 

23.8 

6 

0 

1.3 

28.6 

5 

0 

0.2 

15.4 

4 

0 

5.4 

30.5 

3 

1 

1.3 

20.3 

2 

1 

12.8 

34.7 

2 

1 

1.5 

25.2 

4 

1 

0.5 

18.6 

3 

1 

CASO 

prActico 


Hecho  en  EE.UU. 


otra  mirada 


Autos 

extranjeros 


El  caso  practico  del  capitulo  12  examino  el  efecto  de  la  competencia  extranjera  en  la 
industria  automotriz  cuando  el  numero  de  autos  importados  aumento  continuamente 
durante  las  decadas  de  1970  y  1980. 10  La  industria  automotriz  estadounidense  ha  sido 
asediada  con  quejas  por  la  calidad  del  producto,  despidos  de  trabajadores  y  altos  precios, 
ademas  que  ha  gastado  miles  de  millones  de  dolares  en  publicidad  e  investigacion  para 
producir  un  auto  hecho  en  Estados  Unidos  que  satisfaga  las  demandas  del  consumidor. 
^Han  tenido  exito  para  detener  la  inundacion  de  autos  importados  comprados  por  con- 
sumidores  estadounidenses?  Los  datos  mostrados  en  la  tabla  siguiente  dan  el  numero  de 
autos  importados  (y)  vendidos  en  Estados  Unidos  (en  millones)  durante  los  anos  1969- 
2005.  Para  simplificar  el  analisis,  hemos  codificado  el  ano  usando  la  variable  codificada 
x  =  Ano  —  1969. 
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Ano 

Ano  —  1969,  x 

Numero 
de  autos 
importados,  y 

Ano 

Ano  -  1969,  x 

Numero 
de  autos 
importados,  y 

1969 

0 

1.1 

1987 

18 

3.1 

1970 

1 

1.3 

1988 

19 

3.1 

1971 

2 

1.6 

1989 

20 

2.8 

1972 

3 

1.6 

1990 

21 

2.5 

1973 

4 

1.8 

1991 

22 

2.1 

1974 

5 

1.4 

1992 

23 

2.0 

1975 

6 

1.6 

1993 

24 

1.8 

1976 

7 

1.5 

1994 

25 

1.8 

1977 

8 

2.1 

1995 

26 

1.6 

1978 

9 

2.0 

1996 

27 

1.4 

1979 

10 

2.3 

1997 

28 

1.4 

1980 

11 

2.4 

1998 

29 

1.4 

1981 

12 

2.3 

1999 

30 

1.8 

1982 

13 

2.2 

2000 

31 

2.1 

1983 

14 

2.4 

2001 

32 

2.2 

1984 

15 

2.4 

2002 

33 

2.3 

1985 

16 

2.8 

2003 

34 

2.2 

1986 

17 

3.2 

2004 

35 

2.2 

2005 

36 

2.3 

A1  examinar  una  grafica  de  dispersion  de  estos  datos,  se  encuentra  que  el  numero  de 
autos  importados  no  parece  seguir  una  relacion  lineal  con  el  tiempo  sino  que  exhibe  una 
respuesta  curvilmea.  La  cuestion,  entonces,  es  decidir  si  un  modelo  de  segundo  orden, 
tercero  o  de  orden  superior  describe  en  forma  adecuada  los  datos. 

1 .  Grafique  los  datos  y  trace  lo  que  considere  sean  los  modelos  de  mejor  ajuste  lineal, 
cuadratico  y  cubico. 

2.  Encuentre  los  residuales  usando  el  modelo  de  regresion  lineal  ajustado.  ^Parece  haber 
algun  modelo  en  los  residuales  cuando  se  grafica  contra  x?  7,  Que  modelo  indican  los 
residuales  que  producirfa  un  ajuste  mejor? 

3.  (',Cual  es  el  aumento  en  R2  cuando  usted  ajusta  un  modelo  cuadratico  mas  que  uno 
lineal?  (',E1  coeficiente  del  termino  cuadratico  es  significativo?  7,  El  modelo  cuadra¬ 
tico  ajustado  es  significativamente  mejor  que  el  modelo  lineal  ajustado?  Grafique  los 
residuales  a  partir  del  modelo  cuadratico  ajustado.  i  Lc  parece  que  hay  algun  modelo 
aparente  en  los  residuales  cuando  se  grafique  contra  x? 

4.  ('.Cual  es  el  aumento  en  R2  cuando  compara  el  modelo  cubico  ajustado  con  el  cuadra¬ 
tico  ajustado?  (jEI  modelo  cubico  ajustado  es  significativamente  mejor  que  el  cuadrati¬ 
co  ajustado?  ^Hay  algunos  modelos  en  una  grafica  de  los  residuales  contra  x?  <,Que 
proportion  de  la  variation  en  la  respuesta  y  no  es  considerada  al  ajustar  un  modelo 
cubico?  ('.Debc  considerarse  algun  modelo  polinomial  de  orden  superior?  ^Por  que  si 
o  por  que  no? 
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OBJETIVOS  GENERALES 


Numerosos  tipos  de  estudios  y  experimentos  resultan  en 
variables  de  respuesta  cualitativas  y  no  cuantitativas,  de 
modo  que  las  respuestas  pueden  ser  clasificadas  pero 
no  cuantificadas.  Los  datos  de  estos  experimentos  estan 
formados  por  la  cuenta  o  numero  de  observaciones  que 
caen  en  cada  una  de  las  categorlas  de  respuesta  incluidas 
en  el  experimento.  En  este  capftulo,  nos  ocupamos  de 
metodos  para  analizar  datos  categoricos. 
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ENTRENADOR  PERSONAL 

/Como  determino  el  numero  apropiado  de  grados 
de  libertad? 


/Como  se  califica  una  biblioteca?  /Su  atmosfera 
es  agradable,  abunida  o  demasiado  silenciosa? 
/El  personal  de  la  biblioteca  es  util?  /Las  indi- 
caciones  son  claras  y  nada  ambiguas?  El  metodo 
moderno  dirigido  a  consumidores  para  comer- 
ciar,  en  general,  contiene  el  estudio  sistematico 
hecho  por  organizaciones  respecto  de  los  deseos 
y  necesidades  para  mejorar  sus  servicios  o  pro- 
ductos.  En  el  caso  practico  del  final  de  este  ca- 
pitulo,  examinamos  los  resultados  de  un  estudio 
para  explorar  las  actitudes  de  adultos  jovenes  ha- 
cia  los  servicios  proporcionados  por  bibliotecas. 
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UNA  DESCRIPCION  DEL  EXPERIMENTO 


Numerosos  experimentos  resultan  en  mediciones  que  son  cualitativas  o  categdricas  en 
lugar  de  cuantitativas;  esto  es,  una  cualidad  o  caracteristica  (mas  que  un  valor  nume- 
rico)  se  mide  para  cada  unidad  experimental.  Se  puede  resumir  este  tipo  de  datos  al  crear 
una  lista  de  las  categories  o  caracterfsticas  e  informar  de  una  cantidad  del  numero  de 
mediciones  que  caen  en  cada  categorfa.  A  continuation  veamos  algunos  ejemplos: 


•  Las  personas  se  pueden  clasificar  en  cinco  categories  de  ingreso. 

•  Un  raton  puede  responder  en  una  de  tres  formas  a  un  estfmulo. 

•  Un  dulce  M&M’S  puede  tener  uno  de  seis  colores. 

•  Un  proceso  industrial  manufactura  articulos  que  pueden  ser  clasificados  como 
“aceptables”,  “de  segunda  categorfa”  o  “defectuosos”. 


Estas  son  algunas  de  las  muchas  situaciones  en  las  que  el  conjunto  de  datos  tiene  carac¬ 
terfsticas  apropiadas  para  el  experimento  multinomial. 


EL  EXPERIMENTO  MULTINOMIAL 

•  El  experimento  consta  de  n  intentos  identicos. 

•  El  resultado  de  cada  intento  cae  en  una  de  k  categories. 

•  La  probabilidad  de  que  el  resultado  de  un  solo  intento  caiga  en  una  categorfa 
particular,  por  ejemplo  i,  es  /?,  y  permanece  constante  de  un  intento  a  otro.  Esta 
probabilidad  debe  ser  entre  0  y  1,  para  cada  una  de  las  k  categories  y  la  suma  de 
todas  las  k  probabilidades  es  %pt  =  1 . 

•  Los  intentos  son  independientes. 

•  El  experimentador  cuenta  el  numero  observado  de  resultados  en  cada  categorfa, 
escrito  como  0\,  02,  ...,  Oh  con  Ox  +  02  +  •  ■  •  +  Ok  =  n. 


CONSEJO 


El  experimento  multinomial 
es  una  extension  del 
experimento  binomial.  Para 
un  experimento  binomio, 
k=  2. 


Se  puede  visualizar  el  experimento  multinomial  si  se  considera  un  numero  k  de  cajas 
o  celdas  en  las  que  n  pelotas  se  lanzan.  Los  n  tiros  son  independientes  y  en  cada  tiro 
la  probabilidad  de  hacer  bianco  en  la  i  caja  es  la  misma.  Pero,  esta  probabilidad  puede 
variar  de  una  caja  a  otra;  podrfa  ser  mas  facil  hacer  bianco  en  la  caja  1  que  en  la  caja  3  en 
cada  tiro.  Una  vez  que  todas  las  n  pelotas  se  hayan  tirado,  se  cuenta  el  numero  de  cada  ca¬ 
ja  o  celda,  0i,02,...,  Ok. 

Es  probable  que  haya  notado  la  similitud  entre  el  experimento  multinomial  y  el  experi¬ 
mento  binomial  introducido  en  el  capitulo  5.  De  hecho,  cuando  hay  k  =  2  categories,  los 
dos  experimentos  son  identicos,  excepto  por  la  notation.  En  lugar  de  p  y  q,  escribimos  /? 
y  p2  para  representar  las  probabilidades  para  las  dos  categories,  “exito”  y  “fracaso”.  En 
lugar  de  x  y  (n  —  x),  escribimos  (9  y  02  para  representar  el  numero  observado  de  “exi- 
tos”  y  “fracasos”. 

Cuando  presentamos  la  variable  aleatoria  binomio,  hicimos  inferencias  acerca  del 
parametro  binomial  p  (y  por  default,  q  =  I  —  p)  usando  metodos  de  muestra  grande 
basados  en  la  estadfstica  z.  En  este  capitulo,  extendemos  esta  idea  para  hacer  inferencias 
acerca  de  los  pardmetros  multinomiales,  pu  p2,  . . .,  pk,  usando  un  tipo  diferente  de  esta- 
distica.  Esta  estadfstica,  cuya  distribution  de  muestreo  aproximada  fue  derivada  por  un 
estadistico  ingles  llamado  Karl  Pearson  en  1900,  se  llama  estadfstica  ji  cuadrada  (o  a 
veces  ji  cuadrada  de  Pearson). 
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ESTADISTICA  Jl  CUADRADA  DE  PEARSON 

Suponga  que  n  =  100  pelotas  se  lanzan  a  las  celdas  (cajas)  y  que  sabemos  que  la  proba- 
bilidad  que  una  pelota  caiga  en  la  primera  caja  es  p,  =  .1.  ^Cuantas  pelotas  esperaria- 
mos  que  caigan  en  la  primera  caja?  De  manera  intuitiva,  se  esperarfa  ver  100(.l)  =  10 
pelotas  en  la  primera  caja.  Esto  debe  recordarnos  del  promedio  o  numero  esperado  de 
exitos,  yu.  =  np,  en  el  experimento  binomial.  En  general,  el  numero  esperado  de  pelotas 
que  caigan  en  la  celda  i,  escrito  como  E,,  se  puede  calcular  usando  la  formula 


Ei  =  np, 

para  cualquiera  de  las  celdas  i  =  1,2,  ...,  k. 

Ahora  suponga  que  hacemos  una  hipotesis  de  valores  para  cada  una  de  las  probabi- 
lidades  pu  p2,  ...,  pk  y  calculamos  el  numero  esperado  para  cada  categorfa  o  celda.  Si 
nuestra  hipotesis  es  correcta,  las  cantidades  observadas  de  celda  reales,  (),,  no  deben  ser 
demasiado  diferentes  de  las  cantidades  esperadas  de  celda,  E,  =  np,.  Cuanto  mas  gran- 
des  sean  las  diferencias,  mas  probable  sera  que  la  hipotesis  sea  incorrecta.  La  esta¬ 
distica  ji  cuadrada  de  Pearson  utiliza  las  diferencias  (O,  —  E,)  al  elevar  al  cuadrado 
primeramente  estas  diferencias  para  eliminar  contribuciones  negativas  y  luego  forma 
un  promedio  ponderado  de  las  diferencias  cuadradas. 


ESTADISTICA  DE  PRUEBA  Jl  CUADRADA  DE  PEARSON 

(Pi  ~  E,f 


x2  =  X- 

sumadas  en  todas  las  k  celdas,  con  E,  =  np,. 


CONSEJO 


Las  pruebas  ji  cuadrada  de 
Pearson  siempre  son  pruebas 
de  cola  superior. 


Aun  cuando  la  prueba  matematica  esta  fuera  del  proposito  de  este  libro,  se  puede 
demostrar  que  cuando  n  es  grande,  X2  tiene  una  distribucion  ji  cuadrada  de  probabili- 
dad  aproximada  en  muestreo  repetido.  Si  las  cuentas  de  celda  esperadas  hipoteticas  son 
correctas,  las  diferencias  ( O,  —  E,)  son  pequenas  y  X2  es  cercana  a  0.  Pero,  si  las  pro- 
babilidades  hipoteticas  son  incorrectas,  grandes  diferencias  (O,  —  E,)  resultan  en  un 
valor  grande  de  X2.  Debe  usarse  una  prueba  estadistica  de  cola  derecha  y  buscar 
un  valor  inusualmente  grande  del  estadistico  de  prueba. 

La  distribucion  ji  cuadrada  se  utilizo  en  el  capitulo  10  para  hacer  inferencias  acerca 
de  una  varianza  poblacional  er2.  Al  igual  que  la  distribucion  F,  su  forma  no  es  sime- 
trica  y  depende  de  un  numero  especffico  de  grados  de  libertad.  Una  vez  especificados 
estos  grados  de  libertad,  se  puede  usar  la  tabla  5  del  apendice  I  para  hallar  valores  criti- 
cos  o  para  limitar  el  valor  p  para  una  estadistica  ji  cuadrada  particular.  Como  alterna- 
tiva,  se  puede  usar  el  applet  Chi-Square  Probabilities  (Probabilidades  ji  cuadrada)  para 
hallar  valores  crfticos  o  valores  p  exactos  para  la  prueba. 

Los  grados  de  libertad  apropiados  para  la  estadistica  ji  cuadrada  varfan  dependiendo 
de  la  aplicacion  particular  que  se  utilice.  Aun  cuando  especificaremos  los  grados  de 
libertad  apropiados  para  las  aplicaciones  presentadas  en  este  capitulo,  se  debe  usar  la 
regia  general  dada  a  continuacion  para  determinar  grados  de  libertad  para  la  estadistica 
ji  cuadrada. 


m 


ENTRENADOR  PERSONAL 

^Corno  determino  el  numero  apropiado  de  grados 
de  libertad? 

1.  Empiece  con  el  numero  de  categories  o  celdas  en  el  experimento. 

2.  Reste  un  grado  de  libertad  por  cada  restriction  lineal  en  las  probabilidades  de 
celda.  Siempre  se  pierde  un  df  (grado  de  libertad)  porque  p  |  +/?,+  •••  +  pk  =  I . 
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3.  A  veces  las  cantidades  de  celda  esperadas  no  se  pueden  calcular  directamente  sino 
que  deben  estimarse  usando  los  datos  muestrales.  Reste  un  grado  de  libertad  por 
cada  parametro  poblacional  independiente  que  deba  ser  estimado,  para  obtener  los 
valores  estimados  de  £,. 


Empezamos  con  las  aplicaciones  mas  sencillas  de  la  estadfstica  de  prueba  ji  cuadrada, 
la  prueba  de  bondad  de  ajuste. 


PRUEBA  DE  PROBABILIDADES  DE  CELDA 
ESPECIFICADA:  LA  PRUEBA  DE  BONDAD 
DEL  AJUSTE 

La  hipotesis  mas  sencilla  respecto  a  las  probabilidades  de  celda  especifica  un  valor  nume- 
rico  para  cada  celda.  Las  cantidades  de  celda  esperadas  se  calculan  facilmente  usando 
las  probabilidades  hipoteticas,  E,  =  np,  y  se  usan  para  calcular  el  valor  observado  de  la 
estadfstica  de  prueba  X2.  Para  un  experimento  multinomial  formado  por  k  categorfas  o 
celdas,  la  estadfstica  de  prueba  tiene  una  distribucion  x  aproximada  con  df  =  (k  —  1). 

Un  investigador  disena  un  experimento  en  el  que  una  rata  es  atrafda  al  final  de  una  rampa 
que  se  divide,  llevando  a  puertas  de  tres  colores  diferentes.  El  investigador  hace  que 
la  rata  baje  por  la  rampa  n  =  90  veces  y  observa  las  elecciones  citadas  en  la  tabla  14.1. 
I  La  rata  tiene  (o  ha  adquirido)  preferencia  por  una  de  las  tres  puertas? 


tabla  14.1  Elecciones  de  puerta  de  la  rata 

Puerta 

Verde  Roja  Azul 

Cantidad  observada  (0,)  20  39  31 


Solucion  Si  la  rata  no  tiene  preferencia  en  la  eleccion  de  una  puerta,  a  la  larga  debe 
esperarse  que  la  rata  escogiera  cada  puerta  en  igual  niimero  de  veces.  Esto  es,  la  hipo¬ 
tesis  nula  es 

H0-Pl=  P2=  Pi  = 
contra  la  hipotesis  alternativa 

Hd :  Al  menos  una  p,  es  diferente  de  j 

donde  /?,  es  la  probabilidad  de  que  la  rata  escoja  la  puerta  i,  para  i  =  1,  2  y  3.  Las  canti¬ 
dades  de  celda  esperadas  son  las  mismas  para  cada  una  de  las  tres  categorfas,  es  decir, 
npi  =  90(1/3)  =  30.  La  estadfstica  de  prueba  ji  cuadrada  puede  ahora  calcularse  como 

v( 0,-E f 

X  Et 

_  (20  -  30)2  (39  -  30)2  (31  -  30)2  _ 

30  30  30 


CONSEJO 

La  region  de  rechazo 
p  estan  en  ia  cola  sup 
la  distribucion  ji  cuad 


www.FreeLibros.me 


598  O  CAPITULO  14  anAlisis  de  datos  categoricos 


Para  este  ejemplo,  el  estadfstico  de  prueba  tiene  (k  —  1)  =  2  grados  de  libertad  porque  la 
umca  restriccion  lineal  en  las  probabilidades  de  celda  es  que  deben  sumar  1.  En  conse- 
cuencia,  se  puede  usar  la  tabla  5  del  apendice  I  para  hallar  limites  para  el  valor  p  de  cola 
derecha.  Como  el  valor  observado,  X2  =  6.607,  se  encuentra  entre  x2<m  =  5-99  y  x2025 
=  7.38,  el  valor  p  esta  entre  .025  y  .050.  El  investigador  debe  informar  los  resultados 
como  significativos  al  nivel  de  5%  (P  <  .05),  lo  cual  significa  que  la  hipotesis  nula  de 
no  preferencia  es  rechazada.  Hay  suficiente  evidencia  para  indicar  que  la  rata  tiene  una 
preferencia  por  una  de  las  tres  puertas. 

(;Que  mas  se  puede  decir  acerca  del  experimento,  una  vez  que  se  haya  determinado 
estadfsticamente  que  la  rata  tiene  una  preferencia?  Veamos  los  datos  para  observar 
donde  estan  las  diferencias.  El  applet  The  Goodness-of-Fit  Test  (Prueba  de  bondad  del 
ajuste),  que  se  muestra  en  la  figura  14.1,  ayudara. 


FIGURA  14.1 

Applet  Goodness-of-Fit 


Se  puede  ver  el  valor  de  X2  y  su  valor  p  exacto  (.0482)  en  la  parte  baja  del  applet.  Un 
poco  mas  arriba,  la  barra  sombreada  muestra  la  distribucion  de  las  frecuencias  obser- 
vadas.  Las  barras  azules  representan  categories  que  tienen  un  exceso  de  observaciones 
con  respecto  a  lo  esperado  y  las  celdas  rojas  (grises  en  la  figura  14.1)  indican  un  deficit 
de  observaciones  con  respecto  a  lo  esperado.  La  intensidad  del  color  refleja  la  magni- 
tud  de  la  discrepancia.  Para  este  ejemplo,  la  rata  escogio  las  puertas  roja  y  azul  con  mas 
frecuencia  de  lo  esperado  y  la  puerta  verde  con  menos  frecuencia.  La  puerta  azul  se 
escogio  solo  un  poco  mas  de  un  tercio  del  tiempo: 


No  obstante,  las  proporciones  muestrales  para  las  otras  dos  puertas  son  muy  diferentes  a 
un  tercio.  La  rata  escoge  la  puerta  verde  con  menos  frecuencia,  solo  22%  del  tiempo: 


^=.222 

90 


La  rata  escoge  la  puerta  roja  con  mas  frecuencia,  43%  del  tiempo: 


39 

XX  =  -433 

90 


Se  pueden  resumir  los  resultados  del  experimento  si  se  dice  que  la  rata  tiene  preferen¬ 
cia  por  la  puerta  roja.  ^Se  puede  concluir  que  la  preferencia  es  causada  por  el  color  de 
la  puerta?  La  respuesta  es  negativa;  la  causa  podrfa  ser  algun  otro  factor  fisiologico  o 
psicologico  que  todavfa  no  se  haya  explorado.  jEvite  declarar  una  relacion  causal  entre 
color  y  preferencia! 
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Las  proporciones  de  tipos  de  sangre  A,  B,  AB  y  O  en  la  poblacion  de  todos  los  cauca- 
sianos  en  Estados  Unidos  son  .41,  .10,  .04  y  .45,  respectivamente.  Para  determinar  si  las 
proporciones  poblacionales  reales  se  ajustan  o  no  se  ajustan  a  este  conjunto  de  probabi- 
lidades  reportadas,  se  selecciono  una  muestra  de  200  estadounidenses  y  se  registraron 
sus  fenotipos  sanguineos.  Las  cantidades  de  celda  observadas  y  esperadas  se  muestran 
en  la  tabla  14.2.  Las  cantidades  de  celda  esperadas  se  calculan  como  E,  =  200/?,.  Prueba 
la  bondad  de  ajuste  de  estas  proporciones  de  fenotipo  sanguineas. 


tabla  14.2  Cantidades  de  fenotipos  sanguineos 


A 

B 

AB 

0 

Observadas  (0,) 

89 

18 

12 

81 

Esperadas  (£,) 

82 

20 

8 

90 

Solution  La  hipotesis  a  probar  esta  determinada  por  las  probabilidades  del  modelo: 
H0.  Pi  =  .41;  p2  =  .10;  p3  =  .04;  p4  =  .45 

CONSEJO 

Grados  de  libertad  para  un 
ajuste  simple  de  una  prueba 
de  bondad:  df=  k—  1. 


_  (89  -  82)2  (81  -  90)2  _ 

82  +  +  90  J-/u 

De  la  tabla  5  del  apendice  I,  indizando  df  =  (k  —  1)  =  3,  se  puede  hallar  que  el  valor 
observado  del  estadistico  de  prueba  es  menor  a  ^2100  =  6.25,  de  modo  que  el  valor  p  es 
mayor  a  .10.  No  es  necesario  tener  evidencia  para  rechazar  H0;  esto  es,  no  se  puede  de- 
clarar  que  los  fenotipos  sanguineos  de  caucasianos  estadounidenses  sean  diferentes  de 
los  reportados  ya  antes.  Los  resultados  son  no  significativos. 

Se  pueden  hallar  instrucciones  en  la  section  “Mi  MINITAB"'  al  final  de  este  capitulo 
para  efectuar  la  prueba  de  bondad  del  ajuste  ji  cuadrada  y  generar  los  resultados.  Este 
procedimiento  es  nuevo  en  el  MINITAB  15.  Si  se  usa  una  version  previa  del  MINITAB, 
todavia  se  pueden  generar  resultados  usando  la  funcion  de  calculadora. 


contra 

Hd :  Al  menos  una  de  las  cuatro  probabilidades  es  diferente  del  valor  esperado 
Entonces 


X2  =  I 


(O,  -  E,)2 


Observe  la  diferencia  en  la  hipotesis  de  bondad  de  ajuste  comparada  con  otras  hipo¬ 
tesis  que  se  hayan  probado.  En  la  prueba  de  bondad  de  ajuste,  el  investigador  usa  la 
hipotesis  nula  para  especificar  el  modelo  que  crea  ser  verdadero,  mas  que  un  modelo  que 
espera  demostrar  que  sea  falso.  Cuando  no  pueda  rechazar  H0  en  el  ejemplo  del  tipo  de 
sangre,  los  resultados  fueron  como  se  esperaba.  Es  necesario  tener  cuidado,  no  obstante, 
cuando  se  reporten  resultados  para  pruebas  de  bondad  de  ajuste.  No  se  puede  declarar 
con  confianza  que  el  modelo  sea  absolutamente  correcto  sin  reportar  el  valor  de  /3  para 
algunas  alternativas  practicas. 


EJERCICIOS 


TECNICAS  BASICAS 

14.1  Haga  una  lista  de  las  caracteristicas  de  un 
experimento  multinomial. 


14.2  Use  la  tabla  5  del  apendice  I  para  hallar  el  valor  de 
X  con  la  siguiente  area  a  a  su  derecha: 

a.  a  =  .05,  df=  3  b .  a  =  .01,  df  =  8 
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14.3  De  la  region  de  rechazo  para  una  prueba  ji 
cuadrada  de  probabilidades  si  el  experimento  contiene  k 
categories  en  estos  casos: 

a.  k  =  7,  a  =  .05  b.  k  =  10,  a  =  .01 

14.4  Use  la  tabla  5  del  apendice  I  para  limitar  el  valor  p 
para  una  prueba  ji  cuadrada: 

a.  X2  =  4.29,  df=  5  b.  X2  =  20.62,  df=  6 

14.5  Suponga  que  una  respuesta  puede  caer  en  una  de 
k  =  5  categories  con  probabilidades  pu  p2,  . . .,  ps  y 
que  n  =  300  respuestas  produjeron  estas  cantidades  de 
categorfa: 


Categorfa 

12  3  4 

5 

Cantidad  observada 

47  63  74  51 

65 

a.  Lis  igualmente  probable  que  ocurran  las  cinco 
categories?  ('  Como  se  probaria  esta  hipotesis? 

b.  Si  se  fuera  a  probar  esta  hipotesis  usando  la  estadfstica 
ji  cuadrada,  ^cuantos  grados  de  libertad  tendria  la 
prueba? 

c.  Encuentre  el  valor  critico  de  que  defina  la  region  de 
rechazo  con  a  =  .05. 

d.  Calcule  el  valor  observado  del  estadistico  de  prueba. 

e.  Efectiie  la  prueba  y  exprese  sus  conclusiones. 

14.6  Suponga  que  una  respuesta  puede  caer  en  una  de 
k  =  3  categories  con  probabilidades  p,  =  .4,  p2  =  .3  y 
p3  =  .3  y  n  =  300  respuestas  produjo  estas  cantidades 
de  categorfa: 


Categorfa 

1  2 

3 

Cantidad  observada 

130  98 

72 

7,  Los  datos  dan  suficiente  evidencia  para  indicar  que  las 
probabilidades  de  celda  son  diferentes  respecto  de  las 
especificadas  para  las  tres  categorfas?  Encuentre  el  valor 
p  aproximado  y  uselo  para  tomar  su  decision. 

APLICACIONES 

14.7  Su  carril  preferido  Una  autopista  de  cuatro 
carriles  en  cada  direccion  fue  estudiada  para  ver  si  los 
automovilistas  prefieren  ir  en  los  carriles  interiores. 

Se  observaron  un  total  de  mil  automoviles,  durante  un 
intenso  transito  matutino  y  se  registro  el  numero  de  autos 
en  cada  carril: 


Carril 

1  2 

3 

4 

Cantidad  observada 

294  276 

238 

192 

7,  Los  datos  presentan  suficiente  evidencia  para  indicar 
que  algunos  carriles  son  preferidos  sobre  otros?  Pruebe 
usando  a  =  .05.  Si  hay  algunas  diferencias,  analice  la 
naturaleza  de  los  diferencias. 


14.8  Peonias  Una  peonia  con  petalos  rojos  fue 
cruzada  con  otra  planta  con  petalos  de  franjas.  Un 
genetista  dice  que  75%  de  los  descendientes  de  esta  cruza 
tendran  flores  rojas.  Para  probar  esta  afirmacion,  cien 
semillas  de  esta  cruza  se  recolectaron  y  germinaron,  y  58 
plantas  tenfan  petalos  rojos.  Use  la  prueba  de  bondad  del 
ajuste  ji  cuadrada  para  determinar  si  los  datos  muestrales 
confirman  la  prediccion  del  genetista. 

14.9  Ataques  al  corazon  los  lunes  ^Odia  listed 
los  lunes?  Investigadores  de  Alemania  han  dado  otra 
razon:  concluyeron  que  el  riesgo  de  un  ataque  al  corazon 
para  un  trabajador  puede  ser  hasta  50%  mayor  los  lunes 
que  en  cualquier  otro  dfa.1  Los  investigadores  dieron 
seguimiento  a  ataques  al  corazon  y  paros  coronarios  en 
un  periodo  de  5  anos  entre  330 mil  personas  que  vivfan 
cerca  de  Augsburg,  Alemania.  En  un  intento  por  verificar 
este  dicho,  se  hizo  un  estudio  de  200  trabajadores  que 
habfan  tenido  recientemente  ataques  al  corazon  y  se 
registro  el  dfa  en  que  ocurrieron  estos  ataques  al  corazon: 

Dfa  Cantidad  observada 

Domingo  24 

Lunes  36 

Martes  27 

Miercoles  26 

Jueves  32 

Viernes  26 

Sabado  29 

(-.Los  datos  presentan  suficiente  evidencia  para  indicar 
que  hay  diferencia  en  la  incidencia  de  ataques  al  corazon, 
dependiendo  del  dfa  de  la  semana?  Pruebe  usando 
a  =  .05. 

14.10  Estadfsticas  de  mortalidad  Unas  estadfsticas 
medicas  muestran  que  los  fallecimientos  debidos  a 
cuatro  enfermedades  principales,  llamadas  A,  B,  C  y  D, 
constituyen  15%,  21%,  18%  y  14%,  respectivamente,  de 
todos  los  fallecimientos  no  accidentales.  Un  estudio  de 
las  causas  de  308  fallecimientos  no  accidentales  en  un 
hospital  dieron  las  siguientes  cantidades: 


Enfermedad 

A 

B 

C 

D 

Otro 

Fallecimientos 

43 

76 

85 

21 

83 

('.Estos  datos  dan  suficiente  evidencia  para  indicar  que  las 
proporciones  de  personas,  que  fallecen  de  enfermedades 
A,  B,  C  y  D  en  este  hospital,  a  la  larga  difieren  de  las 
proporciones  acumuladas  para  la  poblacion? 

14.11  Esquizofrenia  Investigaciones  realizadas 
han  sugerido  que  hay  un  vinculo  entre  la  prevalencia 
de  esquizofrenia  y  el  nacimiento  durante  meses 
particulares  del  ano  en  que  prevalecen  infecciones 
virales.  Supongamos  que  estamos  trabajando  en  un 
problema  similar  y  sospechamos  que  hay  un  vinculo 
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entre  una  enfermedad  observada  en  la  etapa  final  de  la 
vida  y  el  mes  de  nacimiento.  Tenemos  registros  de  400 
casos  de  la  enfermedad,  y  las  clasificamos  de  acuerdo  al 
mes  de  nacimiento.  Los  datos  aparecen  en  la  tabla.  yLos 
datos  presentan  suficiente  evidencia  para  indicar  que  la 
proporcion  de  casos  de  la  enfermedad  por  mes  varfa  de 
un  mes  a  otro?  Pruebe  con  a  =  .05. 


Mes 

Enero 

Febrero 

Marzo 

Abril 

Mayo 

Junio 

Nacimientos 

38 

31 

42 

46 

28 

31 

Mes 

Julio 

Agosto 

Sept. 

Oct. 

Nov. 

Die. 

Nacimientos 

24 

29 

33 

36 

27 

35 

14.12  Chfcharos  Supongamos  que  usted  esta 
interesado  en  seguir  dos  caracterfsticas  de  chfcharos: 
textura  de  la  semilla  (S  =  lisa,  s  =  arrugada)  y  color 
de  la  semilla  (Y  =  amarillo,  y  =  verde)  en  una  cruza  de 
segunda  generation  de  padres  heterocigotos.  La  teorfa 
de  Mendel  dice  que  el  numero  de  chfcharos  clasificados 
como  lisos  y  amarillos,  arrugados  y  amarillos,  lisos  y 
verdes,  y  arrugados  y  verdes  debe  estar  en  la  relacion 
9:3:3: 1.  Suponga  que  cien  chfcharos  seleccionados  al 
azar  tienen  56,  19,  17  y  8  en  estas  categorfas  respectivas. 
^Estos  datos  indican  que  el  modelo  9:3:3: 1  es  correcto? 
Pruebe  usando  a  =  .01. 

14.12  fl&M'S  El  sitio  web  Mars,  Incorporated 
publica  los  siguientes  porcentajes  de  los  diversos  colores 
en  sus  dulces  M&M’S  para  la  variedad  “chocolate  con 
leche”:2 


/Que  colores  vienen 

en  una  bolsa? 

Cafe 

13% 

Amarillo 

14% 

Rojo 

13% 

Azul 

24% 

Anaranjado 

20% 

Verde 

|  16% 

Una  bolsa  de  14  onzas  (400  gramos)  de  dulces  M&M’S 
de  chocolate  con  leche  se  selecciona  al  azar  y  contiene 


70  dulces  cafes,  72  amarillos,  61  rojos,  118  azules, 

108  anaranjados  y  85  verdes.  ^Los  datos  justifican  los 
porcentajes  informados  por  Mars,  Incorporated?  Use 
la  prueba  apropiada  y  describa  la  naturaleza  de  las 
diferencias,  si  hay  alguna. 

14.14  M&M'S  de  cacahuate  Los  porcentajes  de 
diversos  colores  son  diferentes  para  la  variedad  de 
“cacahuate”  de  dulces  M&M’S,  como  se  publica  en  el 
sitio  web  Mars,  Incorporated:3 


iQue  colores  vienen 
en  una  bolsa? 

Cafe 

12% 

Amarillo 

15% 

Rojo 

12% 

Azul 

|  23% 

Anaranjado 

23% 

Verde 

15% 

Una  bolsa  de  14  onzas  (400  gramos)  de  dulces  M&M’S 
de  chocolate  con  leche  se  selecciona  al  azar  y  contiene 
70  dulces  cafes,  87  amarillos,  64  rojos,  115  azules, 

106  anaranjados  y  85  verdes.  ^Los  datos  justifican  los 
porcentajes  informados  por  Mars,  Incorporated?  Use 
la  prueba  apropiada  y  describa  la  naturaleza  de  las 
diferencias,  si  hay  alguna. 

14.15  Estandares  de  inscripcion  Los  registros 
previos  de  inscripcion  en  una  gran  universidad  indican 
que  del  numero  total  de  personas  que  solicitaron 
inscripcion,  60%  son  inscritos  incondicionalmente, 

5%  son  inscritos  a  condicion  de  pasar  una  prueba 
y  el  resto  son  rechazados.  De  500  solicitudes  a  la 
fecha  para  el  ano  entrante,  329  solicitantes  han  sido 
inscritos  incondicionalmente,  43  han  sido  inscritos 
a  condicion  de  pasar  una  prueba  y  el  resto  han  sido 
rechazados.  yEstos  datos  indican  una  desviacion  respecto 
a  los  porcentajes  de  inscripcion?  Pruebe  usando  a  =  .05. 
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TABLAS  DE  CONTINGENCIA: 

UNA  CLASIFICACION  DE  DOS  VIAS 

En  algunas  situaciones,  el  investigador  clasifica  una  unidad  experimental  de  acuerdo 
con  dos  variables  cualitativas  para  generar  datos  bivariados,  que  discutimos  en  el  capf- 
tulo  3. 


•  Una  pieza  defectuosa  de  mueble  se  clasifica  segun  el  tipo  de  defecto  y  el  turno 
de  produccion  durante  el  que  se  hizo. 

•  Una  profesora  es  clasificada  por  su  rango  profesional  y  el  tipo  de  universidad 
(publica  o  privada)  en  la  que  trabaje. 

•  Un  paciente  es  clasificado  de  acuerdo  al  tipo  de  tratamiento  preventivo  contra 
la  gripe  que  ha  recibido  y  si  ha  contrafdo  o  no  la  gripe  durante  el  invierno. 


Cuando  se  registran  dos  variables  categdricas,  se  puede  resumir  la  informacion  al  contar 
el  numero  observado  de  unidades  que  caen  en  cada  una  de  las  diversas  intersecciones 
de  niveles  de  categorfa.  Las  cantidades  resultantes  se  exhiben  en  un  conjunto  ordenado 
llamado  tabla  de  contingencia. 

Un  total  de  n  =  309  defectos  en  muebles  fueron  registrados  y  los  defectos  fueron  cla- 
sificados  en  cuatro  tipos:  A,  B,  C  o  D.  Al  mismo  tiempo,  cada  pieza  de  mueble  fue 
identificado  por  el  turno  de  produccion  en  el  que  se  manufacture.  Estas  cantidades  estan 
presentadas  en  una  tabla  de  contingencia  en  la  tabla  14.3. 


tabla  14.3  Tabla  de  contingencia 


Turno 


Tipo  de  defectos 

1 

2 

3 

Total 

A 

15 

26 

33 

74 

B 

21 

31 

17 

69 

C 

45 

34 

49 

128 

D 

13 

5 

20 

38 

Total 

94 

96 

119 

309 

Cuando  se  estudia  informacion  que  contiene  dos  variables,  una  consideration  importante 
es  la  relacion  entre  las  dos  variables,  i  La  proportion  de  mediciones  en  las  diversas  cate¬ 
gories  para  el  factor  1  depende  de  cual  categorfa  del  factor  2  se  observe?  Para  el  ejem- 
plo  de  muebles,  <4  as  proporciones  de  los  diversos  defectos  varfa  de  turno  a  turno,  o  son 
iguales  estas  proporciones,  independientemente  de  cual  turno  se  observe?  Recordemos 
un  fenomeno  similar  llamado  interaccion  en  el  experimento  factorial  a  X  b  del  capf- 
tulo  1 1 .  En  el  analisis  de  una  tabla  de  contingencia,  el  objetivo  es  determinar  si  un  metodo 
de  clasificacion  es  o  no  es  contingente  o  dependiente  del  otro  metodo  de  clasificacion. 
Si  no  lo  es,  se  dice  que  los  dos  metodos  de  clasificacion  son  independientes. 


CONSEJO 


Con  clasificaciones  de  dos 
vias,  no  probamos  hipotesis 
acerca  de  probabilidades 
especificas.  Probamos  si  los 
dos  metodos  de  clasificacion 
son  independientes. 


La  prueba  de  independencia  ji  cuadrada 

La  cuestion  de  independencia  de  los  dos  metodos  de  clasificacion  se  puede  investigar 
usando  una  prueba  de  hipotesis  basada  en  la  estadfstica  ji  cuadrada.  Estas  son  las  hipo¬ 
tesis: 

H0 :  Los  dos  metodos  de  clasificacion  son  independientes 
//a :  Los  dos  metodos  de  clasificacion  son  dependientes 
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CONSEJO 


Grados  de  libertad  para  una 
tabla  de  contingencia  rX  c: 
df=  ( r -  1)(c  -  1). 


Suponga  que  denotamos  la  cantidad  observada  de  celdas  en  la  fila  /  de  la  tabla  de  contin¬ 
gencia  como  Oij.  Si  se  conocieran  las  cantidades  observadas  de  celda  ( Eu  =  np,;)  bajo  la 
hipotesis  nula  de  independencia,  entonces  se  podrfa  usar  la  estadistica  ji  cuadrada  para 
comparar  las  cantidades  observadas  y  esperadas.  No  obstante,  los  valores  esperados  no 
estan  especificados  en  H0,  como  estaban  en  los  ejemplos  previos. 

Para  explicar  como  estimar  estas  cantidades  esperadas  de  celda,  debemos  repasar 
el  concepto  de  eventos  independientes  del  capitulo  4.  Considere  p,n  la  probabilidad  de 
que  una  observacion  cafda  en  la  fila  i  y  la  columna  j  de  la  tabla  de  contingencia.  Si  los 
renglones  y  columnas  son  independientes,  entonces 

Pij  =  /’(observation  cae  en  el  renglon  i  y  columna  j) 

=  /’(observacion  cae  en  el  renglon  i)  X  /’(observacion  cae  en  la  columna  /') 

=  PiPj 

donde  p,  y  p,  son  las  probabilidades  incondicional  o  marginal  de  caer  en  la  fila  i 
o  columna  /',  respectivamente.  Si  se  pudiera  obtener  estimaciones  apropiadas  de  estas 
probabilidades  marginales,  se  podrfan  usar  en  lugar  de  /?,,  en  la  formula  para  la  cantidad 
esperada  de  celda. 

Por  fortuna,  existen  estas  estimaciones.  De  hecho,  son  exactamente  lo  que  en  forma 
intuitiva  se  escogerfa: 

•  Para  estimar  la  probabilidad  de  un  renglon,  use 

„  _  Total  de  observaciones  en  renglon  i  _  r, 

P'  Numero  total  de  observaciones  n 


•  Para  estimar  la  probabilidad  de  una  columna,  use 


p  _  Total  de  observaciones  en  la  columna  j  _  ci 
Numero  total  de  observaciones  n 

La  estimacion  de  la  cantidad  esperada  de  celda  para  el  renglon  i  y  la  columna  j  se  sigue 
de  la  suposicion  de  independencia. 


CANTIDAD  ESTIMADA  ESPERADA  DE  CELDA 


donde  r,  es  el  total  para  el  renglon  i  y  c(  es  el  total  para  la  columna  j. 

El  estadistico  de  prueba  ji  cuadrada  para  una  tabla  de  contingencia  con  r  renglones  y 
c  columnas  se  calcula  como 

E, 

y  puede  mostrarse  que  tiene  una  distribucion  ji  cuadrada  aproximada  con 
df=  (r  ~  l)(c  -  1) 

Si  el  valor  observado  de  X2  es  demasiado  grande,  entonces  la  hipotesis  nula  de  indepen¬ 
dencia  es  rechazada. 
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EJEM 


TABLA 


Consulte  el  ejemplo  14.3.  ^Los  datos  presentan  suficiente  evidencia  para  indicar  que  el 
tipo  de  defecto  de  muebles  varfa  con  el  turno  durante  el  cual  la  pieza  se  produjo? 


Solution  Las  cantidades  estimadas  esperadas  de  celda  se  muestran  en  parentesis  en 
la  tabla  14.4.  Por  ejemplo,  la  cantidad  estimada  esperada  para  un  defecto  tipo  C  produ- 
cido  durante  el  segundo  turno  es 


a  r3c2  (128X96) 

32  n  309 


39.77 


14.4  Cantidades  observadas  y  estimadas  esperadas  de  celda 


Turno 


Tipo  de  defectos 

1 

2 

3 

Total 

A 

15(22.51) 

26  (22.99) 

33  (28.50) 

74 

B 

21  (20.99) 

31  (21.44) 

17(26.57) 

69 

C 

45  (38.94) 

34  (39.77) 

49  (49.29) 

128 

D 

13(11.56) 

5(11.81) 

20(14.63) 

38 

Total 

94 

96 

119 

309 

Ahora  se  pueden  usar  los  valores  mostrados  en  la  tabla  14.4  para  calcular  el  estadfstico 
de  prueba  como 

xl=s<cv^i 

(15  -22.51  )2  (26  -22  ,99)2  (20  -14.63)2 

22.51  +  22  .99  +  "  '  +  14.63 

=  19.18 

Cuando  se  indiza  la  distribution  ji  cuadrada  de  la  tabla  5  del  apendice  I  con 
df=  (r  —  l)(c  —  1)  =  (4  —  1)(3  —  1)  =  6 

el  estadfstico  de  prueba  observada  es  mayor  a  ^2005  =  1 8.5476,  lo  cual  indica  que  el  valor 
p  es  me  nor  a  .005.  Se  puede  rechazar  H0  y  declarar  que  los  resultados  son  altamente 
significativos  (P  <  .005).  Hay  suficiente  evidencia  para  indicar  que  las  proporciones  de 
tipos  de  defecto  varfan  de  un  turno  a  otro. 


La  siguiente  pregunta  obvia  que  se  debe  formular  comprende  la  naturaleza  de  la  rela¬ 
tion  entre  las  dos  clasificaciones.  (:  Cual  turno  produce  mas  de  que  tipo  de  defecto?  A1 
igual  que  con  el  experimento  factorial  del  capftulo  1 1 ,  una  vez  hallada  la  dependencia  (o 
interaction)  se  debe  buscar  dentro  de  la  tabla  en  las  proporciones  relativa  o  conditional 
para  cada  nivel  de  clasificacion.  Por  ejemplo,  considere  el  turno  1,  que  produjo  un  total 
de  94  defectos.  Estos  defectos  se  pueden  dividir  en  tipos  usando  las  proporciones  con- 
dicionales  para  esta  muestra  que  aparecen  en  la  primera  columna  de  la  tabla  14.5.  Si  se 
sigue  el  mismo  procedimiento  para  los  otros  dos  turnos,  se  pueden  entonces  comparar  las 
distribuciones  de  tipos  de  defecto  para  los  tres  turnos,  como  se  ve  en  la  tabla  14.5. 

Ahora  comparemos  los  tres  conjuntos  de  proporciones  (cada  uno  totaliza  1).  Se  ve 
que  los  turnos  1  y  2  producen  defectos  en  el  mismo  orden  general,  tipos  C,  B,  A  y  D 
de  mayor  a  menor,  aunque  en  proporciones  que  difieren.  El  turno  3  presenta  un  modelo 
diferente,  casi  todos  los  defectos  de  tipo  C  pero  seguidos  por  los  tipos  A,  D  y  B,  en  ese 
orden.  Dependiendo  de  cual  tipo  de  defecto  sea  el  mas  importante  para  el  fabricante, 
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cada  turno  debe  ser  advertido  separadamente  acerca  de  las  razones  para  producir  dema- 
siados  defectos. 


tabla  14.5  Probabilidades  condicionales  para  tipos  de  defecto  dentro  de  tres  turnos 


Turno 


Tipos  de  defectos 

1 

2 

3 

A 

15  _ 
94  “ 

.16 

26  _ 
96  ~~ 

.27 

33  _ 
119  ” 

.28 

B 

21  _ 
94  ~~ 

.22 

31  _ 
96  “ 

.32 

17 

119  ~ 

.14 

C 

45  _ 
94  ~~ 

.48 

34  _ 
96  “ 

.35 

49  _ 
119  “ 

.41 

D 

13  _ 

94  " 

.14 

5  _ 
96  ~~ 

.05 

20  _ 
119  ~ 

.17 

Total 

1.00 

1.00 

1.00 

FIGURA  14.2 

Applet  Chi-Square 
Test  of  Independence 
(Prueba  de 
independencia 
ji  cuadrada) 


El  applet  Chi-Square  Test  of  Independence  (Prueba  de  independencia  ji  cuadrada) 
puede  ayudar  a  visualizar  la  distribucion  de  las  frecuencias  observadas.  En  la  figura 
14.2a),  las  barras  azules  (azul  en  la  figura  14.2a))  representan  categorfas  que  tienen 
un  exceso  de  defectos  con  respecto  a  las  celdas  esperadas  y  las  rojas  (grises  en  la 
figura  14.2a))  indican  un  deficit  de  defectos  con  respecto  a  lo  esperado.  La  intensidad 
del  color  refleja  la  magnitud  de  la  discrepancia.  En  la  figura  14.2b),  usamos  el  boton 
. iA-  1  para  ver  la  distribucion  esperada  de  piezas  defectuosas  si  la  hipotesis  nula  es 
verdadera.  Las  alturas  relativas  de  los  rectangulos  en  cada  una  de  las  tres  columnas 
corresponden  a  la  distribucion  condicional  de  piezas  defectuosas  por  turno  dadas  en 
la  tabla  14.5.  Usaremos  este  applet  para  los  Ejercicios  Mi  Applet  al  final  del  capf- 
tulo. 

a)  b) 


123  Sum 


12  3 


1  L 

- 

|ChiSq(6)  =  19.18,  p-value 


0.0039 


|ChiSq(6)  = 


19.1 8,  p-value 


00039 
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EJEM 


TABLA 


m 


ENTRENADOR  PERSONAL 

cComo  determino  el  numero  apropiado  de  grados 
de  libertad? 


Recuerde  el  procedimiento  general  para  determinar  grados  de  libertad: 

1 .  Empiece  con  k  =  rc  categories  o  celdas  en  la  tabla  de  contingencia. 

2.  Reste  un  grado  de  libertad  porque  todas  las  probabilidades  de  celda  rc  deben 
sumar  1. 

3.  Tuvo  que  estimar  (r  —  1)  probabilidades  de  renglon  y  (c  —  1)  probabilidades  de 
columna  para  calcular  las  cantidades  estimadas  esperadas  de  celda.  (La  ultima 
de  las  probabilidades  de  renglon  y  de  columna  esta  determinada  porque  las 
probabilidades  marginales  de  renglon  y  columna  tambien  totalizan  1.)  Reste 

(r  —  c)  y  (c  —  1 )  grados  de  libertad  (df). 

El  total  de  grados  de  libertad  para  la  tabla  rXces 

df  =  rc  —  1  —  (r  —  1)  —  (c  —  1  )  =  rc  —  r  —  c  +  1  =  (r  —  1  )(c  —  1) 


Se  realizo  un  estudio  para  evaluar  la  efectividad  de  una  nueva  vacuna  contra  la  gripe  que 
habta  sido  administrada  en  una  pequena  comunidad.  La  vacuna  fue  aplicada  sin  carga 
en  una  secuencia  de  dos  vacunas  en  un  periodo  de  2  semanas.  Algunas  personas  reci- 
bieron  la  secuencia  de  dos  vacunas,  algunas  se  presentaron  solo  para  una  vacuna  y  las 
otras  no  recibieron  ninguna.  Un  estudio  de  mil  residentes  locales  a  la  primavera  siguiente 
dio  la  information  que  se  ve  en  la  tabla  14.6.  (',Los  datos  presentan  suficiente  evidencia 
para  indicar  que  la  vacuna  tuvo  exito  para  reducir  el  numero  de  casos  de  gripe  en  la 
comunidad? 


Tabla  de  contingencia  de  2x3 

Sin  vacuna 

Una vacuna  Dos vacunas 

Total 

Gripe 

24 

9  13 

46 

Sin  gripe 

289 

100  565 

954 

Total 

313 

109  578 

1000 

Solucion  El  exito  de  la  vacuna  para  reducir  el  numero  de  casos  de  gripe  se  puede 
evaluar  en  dos  partes: 

•  Si  la  vacuna  tiene  exito,  las  proporciones  de  personas  que  contraen  gripe  deberfa 
variar,  dependiendo  de  cual  de  los  tres  tratamientos  recibieron. 

•  Esta  dependencia  no  solo  debe  existir,  sino  que  la  proportion  de  personas  que 
contraen  gripe  deberfa  disminuir  a  medida  que  aumenta  el  tratamiento  de  preven¬ 
tion  de  la  gripe,  de  cero  a  una  o  dos  vacunas. 

La  primera  parte  se  puede  probar  usando  la  prueba  ji  cuadrada  con  estas  hipotesis: 

H0 :  No  hay  relation  entre  tratamiento  e  incidencia  de  gripe 

Hd :  La  incidencia  de  gripe  depende  de  la  cantidad  de  tratamiento  contra  la  gripe 

Como  de  costumbre,  paquetes  de  software  pueden  eliminar  todos  los  tediosos  calculos 
y,  si  los  datos  se  introducen  correctamente,  dan  la  salida  correcta  que  contiene  el  valor 
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CONSEJO 


Use  el  valor  de  X2  y  el  valor 
p  de  la  salida  impresa 
para  probar  la  hipotesis  de 
independencia. 


observado  del  estadfstico  de  prueba  y  su  valor  p.  Esa  salida  impresa,  generada  por  MINI¬ 
TAB,  se  ilustra  en  la  figura  14.3.  Se  pueden  hallar  instrucciones  para  generar  esta  salida 
impresa  en  la  sesion  “Mi  MINITAB”  al  final  de  este  capitulo.  El  valor  observado  del  esta- 
distico  de  prueba,  X2  =  17.313,  tiene  un  valor  /;  de  .000  y  los  resultados  son  declarados 
altamente  significativos.  Esto  es,  la  hipotesis  nula  es  rechazada.  Hay  suficiente  evidencia 
para  indicar  una  relacion  entre  tratamiento  e  incidencia  de  la  gripe. 


FIGURA  14.3 

Salida  MINITAB  del 
ejemplo  14.5 


Prueba  ji  cuadrada:  sin  vacuna,  una  vacuna,  dos  vacunas 


Expected  counts  are  printed  below  observed  counts 
Chi-Square  contributions  are  printed  below  expected  counts 


No 

Vaccine 

One  Shot 

Two  Shots 

Total 

1 

24 

9 

13 

46 

14.40 

5.01 

26.59 

6.404 

3 .169 

6 . 944 

2 

289 

100 

565 

954 

298 . 60 

103 . 99 

551.41 

0.309 

0 . 153 

0.335 

Total 

313 

109 

578 

1000 

Chi-Sq  = 

17.313, 

,  DF  =  2, 

P-Value  = 

0 . 000 

^Cual  es  la  naturaleza  de  esta  relacion?  Para  contestar  esta  pregunta,  vease  la  tabla 
14.7  y  la  figura  14.4,  que  da  la  incidencia  de  gripe  en  la  muestra  para  cada  uno  de  los 
tres  grupos  de  tratamiento.  La  respuesta  es  obvia.  El  grupo  que  recibio  dos  vacunas  fue 
menos  susceptible  a  la  gripe;  solo  una  vacuna  no  parece  reducir  la  susceptibilidad. 


TABLA  14.7 


Incidencia  de  gripe  para  tres  tratamientos 

Sin vacuna  Una  vacuna  Dos  vacunas 


24 

313 


=  .08 


109 


-=  .08 


13 

578 


=  .02 


FIGURA  14.4 

Applet  Chi-Square  Test 
of  Independence 


NoVaccine  OneShot  Two  Shots  Sum 

Flu  |24  |a  p3  p6 

NoFlu  |289  pOO  IsBS  |954 

Sum  j313  p09  pi  1 1000 


NoVaccine  OneShot  Two  Shots 


|ChiSq(2)  =  17.31 ,  p-value  =  2.0E-4 
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EJERCICIOS 


TECNICAS  BASICAS 

14.16  Calcule  el  valor  y  de  el  numero  de  grados  de 
libertad  de  X2  para  estas  tablas  de  contingencia: 

a.  Columnas 


Use  la  salida  impresa  MINITAB  para  determinar  si  hay 
una  diferencia  en  las  respuestas  de  acuerdo  al  genero. 
Explique  la  naturaleza  de  las  diferencias,  si  la  hay. 

Salida  impresa  MINITAB  para  el  ejercicio  14.19 


Renglones  1  2  3  4 

1  120  70  55  16 

2  79  108  95  43 

3  31  49  81  140 

b.  Columnas 

Renglones  1  2  3 

1  35  16  84 

2  120  92  206 

14.17  Suponga  que  un  estudio  de  consumidores 
compendia  las  respuestas  de  n  =  307  personas  en  una 
tabla  de  contingencia  de  tres  renglones  y  cinco  columnas. 
('  Cuantos  grados  de  libertad  estan  asociados  con  el 
estadfstico  de  prueba  ji  cuadrada? 

14.18  Un  estudio  de  400  entrevistados  produjo  estas 
cantidades  de  celda  en  una  tabla  de  contingencia  de 
2X3: 

Columnas 

Renglones  1  2  3  Total 

1  37  34  93  164 

2   66  57  113  236 

Total  103  91  206  400 

a.  Si  se  desea  probar  la  hipotesis  nula  de 
“independencia”,  es  decir,  que  la  probabilidad  de 
que  una  respuesta  caiga  en  cualquier  renglon,  es 
independiente  de  la  columna  en  la  que  caiga  y  se 
piensa  usar  una  prueba  ji  cuadrada,  ^cuantos  grados 
de  libertad  estaran  asociados  con  el  estadfstico  ;y2? 

b.  Encuentre  el  valor  del  estadfstico  de  prueba. 

c.  Encuentre  la  region  de  rechazo  para  a  =  .01. 

d.  Efectue  la  prueba  y  exprese  sus  conclusiones. 

e.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interprete  su  valor. 

14.19  Diferencias  de  genero  Loshombresy 
mujeres  entrevistados  en  un  cuestionario  de  diferencias 
de  genero  se  clasificaron  en  tres  grupos,  segun  sus 
respuestas  en  la  primer  pregunta: 

Grupo  1  Grupo2  Grupo3 

Hombres  37  49  72 

Mujeres  7  50  31 


Prueba  ji  cuadrada:  grupo  1,  grupo  2,  grupo  3 

Expected  counts  are  printed  below  observed  counts 
Chi-Square  contributions  are  printed  below  expected 
counts 


1 

Group  1 

37 

28.26 

2.703 

Group  2 
49 
63.59 
3.346 

Group  3 

72 

66 . 15 
0.517 

Total 

158 

2 

7 

15.74 

4 . 853 

50 
35.41 
6 . 007 

31 

36 . 85 

0 . 927 

88 

Total 

44 

99 

103 

246 

Chi-Sq 

=  18.352, 

DF  =  2, 

P -Value  =  0. 

.  000 

APLICACIONES 

14.20  Asistencia  medica  obligatoria  En  2006, 
una  nueva  ley  aprobada  en  Massachusetts  requerirfa 
que  todos  los  residentes  tuvieran  servicio  medico.  Los 
residentes  de  bajos  ingresos  obtendrfan  subsidios  para 
ayudar  a  pagar  sus  primas,  pero  todos  pagarfan  algo 
por  servicios  de  salud.  El  plan  sancionarfa  a  personas 
sin  ningun  seguro  y  cobrarfa  cuotas  a  empleadores  que 
no  dieran  la  cobertura.  Una  encuesta  de  ABC  News/ 
Washington  Post 4  que  comprendfa  a  n  =  1027  adultos 
en  todo  el  pafs  hizo  la  pregunta,  “/.Apoyarfa  usted  o  se 
opondrfa  a  este  plan  en  su  estado?  Los  datos  siguientes 
estan  basados  en  los  resultados  de  este  estudio. 


Afiliacion 

Apoya 

Se  opone 

No  esta  seguro 

Democratas 

256 

163 

22 

Independientes 

60 

40 

5 

Republicanos 

235 

222 

24 

a.  7,Hay  diferencias  significativas  en  las  proporciones 
de  los  entrevistados  que  apoyan,  se  oponen  y  no 
estan  seguros  acerca  de  este  plan  entre  democratas, 
independientes  y  republicanos?  Use  a  =  .05. 

b.  Si  existen  diferencias  significativas,  describa  la 
naturaleza  de  las  diferencias  al  hallar  las  proporciones 
de  quienes  apoyan,  se  oponen  y  no  estan  seguros  por 
cada  una  de  las  afiliaciones  dadas. 

14.21  Infantes  ansiosos  Joseph  Jacobson  y  Diane 
Wille  realizaron  un  estudio  para  determinar  el  efecto 
atencion  temprana  infantil  en  los  patrones  de  union 
entre  madre  e  hijo.5  En  el  estudio,  93  infantes  fueron 
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clasificados  como  “seguros”  o  “ansiosos”  usando  el 
paradigma  de  situation  extrana  de  Ainsworth.  Ademas, 
los  infantes  fueron  clasificados  de  acuerdo  al  numero 
promedio  de  horas  por  semana  que  pasaron  recibiendo 
atencion  y  cuidado.  Los  datos  se  presentan  en  la  tabla. 

Baja  Moderada  Alta 

(0-3  horas)  (4-19  horas)  (20-54  horas) 

Seguro  24  35  5 

Ansioso  11  10  8 

a.  /.Los  datos  dan  suficiente  evidencia  para  indicar  que 
hay  una  diferencia  en  el  patron  de  union  para  los 
infantes,  dependiendo  del  tiempo  que  pasen 

en  atencion  y  cuidado?  Pruebe  usando  a  =  .05. 

b.  /.Cual  es  el  valor  p  aproximado  para  la  prueba  del 
inciso  a)? 

14.22  Patrones  de  gasto  /Hay  diferencia  en 
los  patrones  de  gasto  de  estudiantes  de  ultimo  ano  de 
preparatoria,  dependiendo  de  su  genero?  Un  estudio 
para  investigar  esta  pregunta  se  concentro  en  196 
estudiantes  de  ultimo  ano  de  preparatoria  ya  empleados. 
A  los  estudiantes  se  les  pidio  clasificaran  la  cantidad  de 
sus  ganancias  que  gastaron  en  su  auto  durante  un  mes 
determinado: 

Nada  o  Todoo 

muypoco  Algo  La  mitad  Casitodo  casitodo 

Hombres  73  12  6  4  3 

Mujeres  57  15  11  9  6 

Una  parte  de  la  salida  impresa  MINITAB  se  da  aquf.  Use  la 
salida  impresa  para  analizar  la  relation  entre  patrones  de 
gasto  y  genero.  Escriba  un  breve  parrafo  que  explique  sus 
conclusiones  estadfsticas  y  las  implicaciones  practicas  de 
estas. 

Salida  impresa  parcial  MINITAB  para  el  ejercicio  14.22 

Prueba  ji  cuadrada:  nada,  algo,  la  mitad,  casi  todo,  todo 

Chi-Sq  =  6.696,  DF  =  4 ,  P-Value  =  0.153 
2  cells  with  expected  counts  less  than  5 . 

14.23  In  espera  de  una  receta  /.Cuanto  tiempo 
espera  usted  para  recibir  una  receta?  De  acuerdo  con  USA 
Today,  “entre  tres  y  10  estadounidenses  esperan  su  receta 
mas  de  20  minutos”.6  Suponga  que  una  comparacion  de 
tiempos  de  espera,  en  farmacias  de  Organizaciones  de 
Servicio  Medico  (HMO)  y  farmacias  de  venta  al  publico, 
produjo  los  siguientes  resultados. 

Tiempo  de  espera  HMO  Farmacias 


<  15  minutos 

75 

119 

16-20  minutos 

44 

21 

>  20  minutos 

21 

37 

No  sabe 

10 

23 

a.  /.Hay  suficiente  evidencia  para  indicar  que  hay  una 
diferencia  en  tiempos  de  espera  en  las  HMO  y  en 
farmacias  de  venta  al  publico?  Use  a  =  .01. 

b.  Si  consideramos  solo  si  el  tiempo  de  espera  es  mas  de 
20  minutos,  /.hav  diferencia  significativa  en  tiempos 
de  espera  entre  farmacias  del  HMO  y  las  de  venta  al 
publico,  al  nivel  de  significancia  de  1%? 

(^)datos  14.24  El  asesinato  de  JFK  Masde40 

anos  despues  del  asesinato  de  John  F.  Kennedy, 
una  encuesta  de  FOX  News  muestra  que  la  mayorfa  de 
estadounidenses  no  estan  de  acuerdo  con  las  conclusiones 
del  gobierno  acerca  del  asesinato.  La  Comision  Warren 
encontro  que  Lee  Harvey  Oswald  actuo  solo  cuando  le 
disparo  a  Kennedy,  pero  la  ciudadama  no  esta  segura  de 
esto.  /.Piensa  usted  que  conocemos  todos  los  datos  acerca 
del  asesinato  del  presidente  Kennedy  o  piensa  que  hay 
encubrimiento?  Veamos  a  continuation  los  resultados 
de  una  encuesta  de  900  votantes  registrados  a  nivel 
national:7 

Conocemos  todos  Hubo 

los  datos  encubrimiento  No  esta  seguro 


Democratas 

42 

309 

31 

Republicanos 

64 

246 

46 

Independientes 

20 

115 

27 

a.  /.Los  datos  dan  suficiente  evidencia  para  concluir  que 
hay  diferencia  de  opiniones  de  votantes  acerca  de 

un  posible  encubrimiento,  dependiendo  de  la  afilia- 
cion  pobtica  del  votante?  Pruebe  usando  a  =  .05. 

b.  Si  hay  diferencia  significativa  en  el  inciso  a),  describa 
la  naturaleza  de  estas  diferencias. 

(^) datos  14.25  Trabajo  a  distancia  Como 

alternativa  del  tiempo  flexible,  numerosas 
companfas  permiten  que  sus  empleados  hagan  parte  de 
su  trabajo  en  casa.  Las  personas  de  una  muestra  aleatoria 
de  300  trabajadores  se  clasificaron  de  acuerdo  al  salario  y 
numero  de  dfas  de  trabajo  por  semana  que  pasan  en  casa. 


Dias  de  trabajo  en  casa  por  semana 


Salario 

Menos  de 

uno 

Al  menos  uno, 
pero  no  todos 

Todos  en  casa 

Menos  de  $25000 

38 

16 

14 

$25000  a  $49999 

54 

26 

12 

$50000  a  $74999 

35 

22 

9 

Mas  de  $75000 

33 

29 

12 

a.  /.Los  datos  presentan  suficiente  evidencia  para 
indicar  que  el  salario  depende  del  numero  de  dfas  de 
trabajo  que  pasan  en  casa?  Pruebe  usando  a  =  .05. 

b.  Use  la  tabla  5  del  apendice  I  para  aproximar  el  valor  p 
para  esta  prueba  de  hipotesis.  /.El  valor  p  confirma  sus 
conclusiones  del  inciso  a)? 
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(^)datos  14.26  Trabajo  a  distancia  II  Unarticulo 
en  American  Demographics  abordo  el  mismo 
problema  de  teletrabajo  (ejercicio  14.25)  en  una  forma 
un  poco  diferente.  Concluyeron  que  “las  personas  que 
trabajan  exclusivamente  en  casa  tienden  a  ser  de  mayor 
edad  y  con  mas  educacion  que  quienes  tienen  que  salir 
de  casa  a  trabajar”,8  Use  los  datos  siguientes  basados  en 
muestras  aleatorias  de  300  trabajadores,  cada  uno  de  los 
cuales  apoyan  o  refutan  sus  conclusiones.  Use  la  prueba 
de  hipotesis  apropiada  y  explique  por  que  esta  de  acuerdo 
o  en  desacuerdo  con  las  conclusiones  del  American 
Demographics.  Observe  que  los  trabajadores  “mixtos” 
son  aquellos  que  informan  de  trabajar  en  casa  al  menos 
todo  un  dfa  en  una  semana  tfpica. 


Trabajadores 


Edad 

No  en  casa 

Mixto 

En  casa 

15-34 

73 

23 

12 

35-54 

85 

40 

23 

55  y  mas 

22 

12 

10 

Trabajadores 

Educacion 

No  en 

casa  Mixto  En  casa 

Menos  de  preparatoria 

23 

3 

5 

Graduado  de  preparatoria 

54 

12 

11 

Algun  grado  de  colegio/universidad 

53 

24 

14 

Licenciatura  o  mas 

41 

42 

18 

COMPARACION  DE  VARIAS 
POBLACIONES  MULTINOMIALES: 

UNA  CLASIFICACION  DE  DOS  VIAS 
CON  TOTALES  DE  RENGLON 
O  COLUMNA  FIJOS 

Una  tabla  de  contingencia  r  X  c  resulta  cuando  cada  una  de  las  n  unidades  experi- 
mentales  se  cuenta  como  si  cayera  en  una  de  las  rc  celdas  de  un  experimento  multino¬ 
mial.  Cada  celda  representa  un  par  de  niveles  de  categorfa,  nivel  de  renglon  i  y  nivel  de 
columna  j.  A  veces,  sin  embargo,  no  es  aconsejable  usar  este  tipo  de  diseno  experimen¬ 
tal,  es  decir,  hacer  que  n  observaciones  caigan  donde  puedan.  Por  ejemplo,  supongamos 
que  se  desea  estudiar  las  opiniones  de  familias  estadounidenses  acerca  de  sus  niveles  de 
ingreso,  es  decir,  bajos,  regulares  y  altos.  Si  al  azar  se  seleccionan  n  =  1200  familias 
para  ese  estudio,  puede  que  no  se  encuentre  ninguna  que  se  clasifique  a  sf  misma  como 
de  bajos  ingresos.  Podrfa  ser  mejor  decidir  por  anticipado  hacer  un  estudio  de  400  fami¬ 
lias  de  cada  nivel  de  ingreso.  Los  datos  resultantes  apareceran  todavfa  como  clasificacion 
de  dos  vfas,  pero  los  totales  de  columna  son  fijos  por  anticipado. 

En  otro  experimento  de  prevencion  de  gripe  como  el  del  ejemplo  14.5,  el  experimenta- 
dor  decide  buscar  en  registros  clinicos  los  300  pacientes  de  cada  una  de  las  tres  cate- 
gorfas  de  tratamiento:  sin  vacuna,  una  vacuna  y  dos  vacunas.  Los  n  =  900  pacientes 
se  encuestaran  entonces  respecto  a  su  historial  de  gripe  en  invierno.  El  experimento 
resulta  en  una  tabla  de  2  X  3  con  los  totales  de  columna  fijos  en  300,  como  se  ve  en  la 
tabla  14.8.  Al  fijar  los  totales  de  columna,  el  experimentador  ya  no  tiene  un  experimento 
multinomial  con  2X3  celdas.  En  cambio,  hay  tres  experimentos  binomiales  separados, 
llamemoslos  1,  2  y  3,  cada  uno  con  una  probabilidad  p,  determinada  de  contraer  la  gripe 
y  qj  de  no  contraer  la  gripe.  (Recuerde  que  para  una  poblacion  binomial,  p,  +  q,  =  1.) 


tabla  14.8  Casos  de  gripe  para  tres  tratamientos 


Sin  vacuna 

Una  vacuna 

Dos  vacunas 

Total 

Gripe 

0 

Sin  gripe 

h 

Total 

300 

300 

300 

n 

www.FreeLibros.me 


1 4.5  COMPARACION  DE  VARIAS  POBLACIONES  MULTINOMIALES:  UNA  CLASIFICACION  DE  DOS  VlAS  CON  TOTALES  DE  RENGLON  0  COLUMNA  FIJOS  O  611 


Supongamos  que  se  utilizo  la  prueba  ji  cuadrada  para  la  independencia  de  clasifica- 
ciones  de  renglon  y  columna.  Si  un  tratamiento  particular  (nivel  de  columna)  no  afecta  la 
incidencia  de  gripe,  entonces  cada  una  de  las  tres  poblaciones  binomiales  deberfa  tener 
la  misma  incidencia  de  gripe  para  que  pt  =  p2  =  p3  y  qi  =  q2  =  t/3. 


La  clasificacion  de  2  X  3  del  ejemplo  14.6  describe  una  situation  en  la  que  la  prueba 
de  ji  cuadrada  de  independencia  es  equivalente  a  una  prueba  de  la  igualdad  de  c  =  3 
proporciones  binomiales.  Pruebas  de  este  tipo  se  llaman  pruebas  de  homogeneidad  y 
se  usan  para  comparar  diversas  poblaciones  binomiales.  Si  hay  mas  de  dos  categories  de 
renglon  con  totales  fijos  de  columna,  entonces  la  prueba  de  independencia  es  equivalente 
a  una  prueba  de  la  igualdad  de  c  conjuntos  de  proporciones  multinomiales. 

No  es  necesario  preocuparse  de  la  equivalencia  teorica  de  las  pruebas  ji  cuadrada 
para  estos  dos  disenos  experimentales.  Si  las  columnas  (o  renglones)  son  fijos  o  no,  la 
estadfstica  de  prueba  se  calcula  como 


X2 


donde  Ei}  =  -jj- 


que  tiene  una  distribution  ji  cuadrada  aproximada  en  muestreo  repetido  con  df  = 
(r  ~  l)(c  -  1). 


de  libertad? 

Recuerde  el  procedimiento  general  para  determinar  grados  de  libertad: 


1.  Empiece  con  las  rc  celdas  en  la  tabla  de  dos  vfas. 

2.  Reste  un  grado  de  libertad  por  cada  una  de  las  c  poblaciones  multinomiales,  cuyas 
probabilidades  de  columna  deben  totalizar  uno,  un  total  de  c  grados  de  libertad. 

3.  Tuvo  que  estimar  (/ —  1)  probabilidades  de  renglon,  pero  las  probabilidades  de 
columna  se  fijan  por  anticipado  y  no  necesitaban  ser  estimadas.  Reste  (r  —  1)  df 

El  total  de  grados  de  libertad  para  la  tabla  r  X  c  (columna  fija)  es 
rc  —  c  —  {r  —  1)  =  rc  —  c  —  r  +  1  =  (r  —  l)(c  —  1) 


EJEMPLO 


Una  encuesta  de  conceptos  de  votantes  fue  realizada  en  cuatro  distritos  politicos  del  cen¬ 
tra  de  una  ciudad,  para  comparar  las  fracciones  de  votantes  que  estan  a  favor  del  candi¬ 
date  A.  Muestras  aleatorias  de  200  votantes  se  encuestaron  en  cada  uno  de  los  cuatro 
distritos  con  los  resultados  que  se  ven  en  la  tabla  14.9.  Los  valores  en  parentesis  de  la 
tabla  son  las  cantidades  esperadas  de  celda.  (Los  datos  presentan  suficiente  evidencia 
para  indicar  que  las  fracciones  de  votantes  que  estan  a  favor  del  candidato  A  difieren  en 
los  cuatro  distritos? 


TABLA  14.9  Opiniones  de  votantes  en  cuatro  distritos 


Distrito 


1 

2 

3 

4 

Total 

A  favor  de  A 

76(59) 

53 (59) 

59  (59) 

48 (59) 

236 

No  a  favor  de  A 

124(141) 

147(141) 

141  (141) 

152(141) 

564 

Total 

200 

200 

200 

200 

800 
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FIGURA  14.5 

Salida  impresa  MINITAB 
para  el  ejemplo  14.7 


TABLA  14.10 


Solucion  Como  los  totales  de  columna  estan  fijos  en  200,  el  diseno  comprende  cuatro 
experimentos  binomiales,  cada  uno  de  los  cuales  contiene  las  respuestas  de  200  votantes 
para  cada  uno  de  los  cuatro  distritos.  Para  probar  la  igualdad  de  las  proporciones  que 
estan  a  favor  del  candidato  A  en  los  cuatro  distritos,  la  hipotesis  nula 

H0\pi=p2=  p3  =  Pa 
es  equivalente  a  la  hipotesis  nula 

H0 :  La  proportion  a  favor  del  candidato  A  es  independiente  del  distrito 

y  sera  rechazada  si  la  estadistica  de  prueba  X2  es  demasiado  grande.  El  valor  observado 
del  estadistico  de  prueba,  X2  =  10.722,  y  su  valor  p  asociado,  .013,  se  muestran  en  la 
figura  14.5.  Los  resultados  son  significativos  (P  <  .025);  esto  es,  H0  es  rechazada  y  se 
puede  concluir  que  hay  diferencia  en  las  proporciones  de  votantes  que  estan  a  favor  del 
candidato  A  entre  los  cuatro  distritos. 


Prueba  ji  cuadrada:  distrito  1,  distrito  2,  distrito  3,  distrito  4 

Expected  counts  are  printed  below  observed  counts 
Chi-Square  contributions  are  printed  below  expected  counts 


1 

Ward  1 
76 
59 . 00 

4 . 898 

Ward  2 
53 
59 . 00 
0.610 

Ward  3 
59 
59 . 00 

0 . 000 

Ward  4 

48 

59.00 

2 . 051 

Total 

236 

2 

124 
141 . 00 

2 . 050 

147 

141.00 

0.255 

141 
141 . 00 

0 . 000 

152 
141 . 00 

0 . 858 

564 

Total 

200 

200 

200 

200 

800 

Chi-Sq 

=  10.722 

DF  =  3, 

P-Value  = 

0 . 013 

/Cual  es  la  naturaleza  de  las  diferencias  descubiertas  por  la  prueba  ji  cuadrada?  Para 
contestar  esta  pregunta,  vease  la  tabla  14.10,  que  muestra  las  proporciones  muestrales 
que  estan  a  favor  del  candidato  A  en  cada  uno  de  los  cuatro  distritos.  Parece  que  el 
candidato  A  esta  haciendolo  mejor  en  el  primer  distrito  y  peor  en  el  cuarto  distrito.  /Es 
esto  de  alguna  significancia  practica  para  el  candidato?  Posiblemente  una  observation 
mas  importante  es  que  el  candidato  no  tiene  una  pluralidad  de  votantes  en  ninguno  de 
los  cuatro  distritos.  Si  esta  es  una  carrera  de  dos  candidatos,  el  candidato  A  necesita 
aumentar  su  campana. 


Proporciones  a  favor  del  candidato  A  en  cuatro  distritos 


Distrito  1 

Distrito  2 

Distrito  3 

Distrito  4 

76/200  =  .38 

53/200  =  .27 

59/200  =  .30 

48/200  =  .24 
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© 


EJERCICIOS 


TECNICAS  BASICAS 

14.27  Muestras  aleatorias  de  200  observaciones  fueron 
seleccionadas  de  cada  una  de  tres  poblaciones  y  cada 
observation  fue  clasificada  de  acuerdo  a  si  cayo  en  una 
de  tres  categories  mutuamente  exclusiva: 


Categoria 


Poblacion 

1 

2 

3 

Total 

1 

108 

52 

40 

200 

2 

87 

51 

62 

200 

3 

112 

39 

49 

200 

Se  desea  saber  si  los  datos  dan  suficiente  evidencia  para 
indicar  que  las  proporciones  de  observaciones  en  las 
tres  categorfas  dependen  de  la  poblacion  de  la  cual  se 
sacaron. 

a.  De  el  valor  de  X2  para  la  prueba. 

b.  De  la  region  de  rechazo  para  la  prueba  para  a  =  .01. 

c.  Exprese  sus  conclusiones. 

d.  Encuentre  el  valor  p  aproximado  para  la  prueba 
e  interprete  su  valor. 

14.28  Suponga  que  se  desea  probar  la  hipotesis  nula  de 
que  tres  parametros  binomiales  pA,  pB  y  pc  son  iguales 
contra  la  hipotesis  alternativa  de  que  al  menos  dos  de  los 
parametros  difieren.  Muestras  aleatorias  independientes 
de  cien  observaciones  se  seleccionaron  de  entre  cada 
una  de  las  poblaciones.  Los  datos  se  muestran  en  la  tabla. 

Poblacion 

ABC  Total 

Exitos  24  19  33  76 

Fracasos  76  81  67  224 

Total  100  100  100  300 

a.  Escriba  las  hipotesis  nula  y  alternativa  para  probar  la 
igualdad  de  las  tres  proporciones  binomiales. 

b.  Calcule  el  estadistico  de  prueba  y  encuentre  el  valor  p 
aproximado  para  la  prueba  en  el  inciso  a). 

c.  Use  el  valor  p  aproximado  para  determinar  la 
significance  estadfstica  de  sus  resultados.  Si  los 
resultados  son  estadfsticamente  significativos,  explore 
la  naturaleza  de  las  diferencias  en  las  tres  proporciones 
binomiales. 


En  una  encuesta  telefonica  de  estadounidenses  entre  40 
y  55  anos  de  edad  realizada  por  el  New  York  Times,9  el 
numero  que  dan  apoyo  financiero  a  sus  familiares  aparece 
en  la  siguiente  tabla. 


Dan  apoyo  financiero 

Si 

No 

Estadounidenses  blancos 

40 

160 

Afroestadounidenses 

56 

144 

Flispanoestadounidenses 

68 

132 

Estadounidenses  asiaticos 

84 

116 

^Hay  una  diferencia  significativa  en  la  proportion  de 
individuos  que  dan  apoyo  financiero  a  sus  familiares  para 
estas  subpoblaciones  de  estadounidenses?  Use  a  =  .01. 

14.30  Polios  enfermos  Se  piensa  que  una  enfermedad 
particular  en  polios  no  es  comunicable.  Para  probar 
esta  teorfa,  30  mil  polios  se  dividieron  al  azar  en  tres 
grupos  de  10  mil.  Un  grupo  no  tenia  contacto  con  polios 
enfermos,  uno  tenia  contacto  moderado  y  el  tercero  tenia 
contacto  frecuente.  Despues  de  6  meses,  se  recabaron 
datos  sobre  el  numero  de  polios  enfermos  en  cada  grupo 
de  10  mil.  (jLos  datos  dan  suficiente  evidencia  para 
indicar  una  dependencia  entre  la  cantidad  de  contacto 
entre  aves  enfermas  y  no  enfermas  y  la  incidencia  de 
la  enfermedad?  Use  a  =  .05. 

Contacto 

Sin  contacto  moderado  Contacto  frecuente 

Enfermedad  87  89  124 

No  enfermedad  9913  9911  9876 

Total  10000  10000  10000 

(^)datos  14.31  Atencion  a  largo  plazo  Un 

estudio  realizado  en  el  noroeste  de  Inglaterra 
hizo  una  evaluation  de  instalaciones  de  atencion  a  largo 
plazo  que  tienen  residentes  con  demencia.10  Las  casas 
incluian  aquellas  que  daban  servicio  especializado  a 
personas  ancianas  con  enfermedad  o  problemas  de  salud, 
conocidas  como  “casas  EMI”,  asi  como  otras  clasifica- 
das  como  “casas  no  EMI”.  Se  esperaba  que  las  casas  EMI 
tuvieran  una  clasificacion  mas  alta  en  varias  medidas 
de  calidad  de  servicio  para  personas  con  demencia.  Una 
medida  incluia  la  estructura  de  la  casa  y  los  servicios 
proporcionados,  como  se  da  en  la  tabla  siguiente. 


Tipo  de  casa 


APLICACIONES 

Tipo  de  atencion 

EMI 

NoEMI 

Total 

14.29  La  generacion  del  sandwich  ^Enque 

Enfermeria 

54 

22 

76 

forma  los  estadounidenses  de  la  “generacion  sandwich” 

Atencion  residencial 

59 

77 

136 

equilibran  las  demandas  de  cuidar  a  familiares  mas  viejos 

Doble  registro 

49 

26 

75 

y  mas  jovenes? 

Total 

162 

125 

287 
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a.  Describa  los  experimentos  binomiales  cuyas 
proporciones  se  han  comparado  en  este  experimento. 

b.  <',Listos  datos  indican  que  el  tipo  de  atencion  propor- 
cionado  varia  por  los  tres  tipos  de  casa?  Pruebe  al 
nivel  a  =  .01. 

c.  Con  base  en  los  resultados  del  inciso  b),  explique  la 
naturaleza  practica  de  la  relation  entre  el  tipo  de  casa 
y  el  tipo  de  atencion. 

14.32  Investigation  de  mares  prof  undos  W.W. 

Menard  ha  realizado  investigaciones  respecto  a  nodulos 
de  manganeso,  una  mezcla  rica  en  minerales  hallada 
en  abundancia  en  el  lecho  de  mares  profundos.11  En 
una  parte  de  su  informe,  Menard  proporciona  datos  que 
relacionan  la  edad  magnetica  de  la  corteza  terrestre  con 
la  “probabilidad  de  hallar  nodulos  de  manganeso”.  La 
tabla  siguiente  da  el  numero  de  muestras  del  nucleo  de 
la  tierra  y  el  porcentaje  de  las  que  contienen  nodulos 
de  manganeso  para  cada  una  de  un  conjunto  de 
edades  de  la  corteza  magnetica.  6Estos  datos  dan 
suficiente  evidencia  para  indicar  que  la  probabilidad 
de  hallar  nodulos  de  manganeso  en  la  corteza  de  mares 
profundos  de  la  Tierra  depende  de  la  clasificacion  de 
edad  magnetica? 


Edad 

Numero  de 
muestras 

Porcentaje 
con  nodulos 

Mioceno;  reciente 

389 

5.9 

Oligoceno 

140 

17.9 

Eoceno 

214 

16.4 

Paleoceno 

84 

21.4 

Cretacico  tardfo 

247 

21.1 

Cretacico  temprano  o  medio 

1120 

14.2 

Jurasico 

99 

11.0 

(^)datos  14.33  ^Que  tan  grande  es  la  familia?  Una 

camara  de  comercio  local  encuesto  a  120  fami- 
lias  en  su  ciudad,  40  en  cada  uno  de  tres  tipos  de 


residencia  (departamentos,  duplex  o  casas  solas) 
y  registro  el  numero  de  miembros  en  cada  una  de  las 
familias.  Los  datos  se  muestran  en  la  tabla. 


Miembros 
de  familia 


1 

2 

3 

4  o  mas 


Tipo  de  residencia 


Departamento  Duplex  Casa  sola 

8  20  1 

16  8  9 

10  10  14 

6  2  16 


7,  Hay  diferencia  significativa  en  las  distribuciones  del 
tamano  de  familia  para  los  tres  tipos  de  residencia? 
Pruebe  usando  a  =  .01.  Si  hay  diferencias  significativas, 
describa  su  naturaleza. 

(^)datos  14.34  lr  a  la  iglesia  y  edad  Unafotoen 
USA  Today  indica  que  hay  una  brecha  en  los 
feligreses  de  iglesias  entre  estadounidenses  de  20  anos  y 
de  mas  edad.12  Suponga  que  al  azar  seleccionamos  cien 
estadounidenses  en  cada  uno  de  los  cinco  grupos  de  edad 
y  registramos  los  numeros  que  dicen  que  van  a  la  iglesia 
en  una  semana  tfpica. 

iAsiste  regularmente?  20s  30s  40s  50s  604- 

Si  31  42  47  48  53 

No_ 69  58  53  52  47 

Fuente:  Barna  Research  Group 

a.  (:,Estos  datos  indican  que  la  proporcion  de  adultos  que 
van  a  la  iglesia  difiere  regularmente  dependiendo  de  la 
edad?  Pruebe  usando  a  =  .05. 

b.  Si  hay  diferencias  significativas  en  el  inciso  a), 
describa  la  naturaleza  de  estas  diferencias  al  calcular 
la  proporcion  de  quienes  van  a  la  iglesia  en  cada 
categorfa  de  edad.  ^Donde  parece  que  estan  las 
diferencias  significativas? 


LA  EQUIVALENCE  DE  PRUEBAS 
ESTADISTICAS 

Recuerde  que  cuando  hay  solo  k  =  2  categories  en  un  experimento  multinomial,  el 
experimento  se  reduce  a  un  experimento  binomial  donde  se  registra  el  numero  de  exi- 
tos  x  (o  Ox)  en  n  (o  0{  +  02)  intentos.  Del  mismo  modo,  los  datos  que  resultan  de  dos 
experimentos  binomiales  se  pueden  exhibit-  en  una  clasificacion  de  dos  vtas  con  r  =  2  y 
c  =  2,  de  modo  que  la  prueba  ji  cuadrada  de  homogeneidad  se  puede  usar  para  comparar 
las  dos  proporciones  binomiales,  px  y  p2.  Para  estas  dos  situaciones,  hemos  presentado 
pruebas  estadfsticas  para  las  proporciones  binomiales  basadas  en  el  estadfstico  z  del 
capttulo  9: 
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•  Una  muestra:  z  =  E _ E° 

\Poqo 

V  n 


k  =  2 


Exitos 


Fracasos 


•  Dos  muestras:  z 


Pi  ~  Pi 


r  =  c  =  2 


Muestra  1 

Muestra  2 

Exitos 

Exitos 

Fracasos 

Fracasos 

CONSEJO 


Las  pruebas  binomiales  de 
una  y  de  dos  muestras  del 
capitulo  9  son  equivalentes  a 
pruebas  ji  cuadrada,  z2  =  \ 2- 


£  Por  que  hay  dos  pruebas  diferentes  para  la  misma  hipotesis  estadfstica?  ^Cual  debe- 
ria  usarse?  Para  estas  dos  situaciones,  se  puede  usarya  sea  la  prueba  z  o  bien  la  prueba  ji 
cuadrada,  y  se  obtendran  resultados  identicos.  Para  la  prueba  de  una  o  de  dos  muestras, 
podemos  demostrar  algebraic  ament e  que 

2  2 

2  =X 

de  modo  que  el  estadfstico  de  prueba  z  sera  la  rafz  cuadrada  (ya  sea  positiva  o  negati- 
va,  dependiendo  de  los  datos)  del  estadfstico  ji  cuadrada.  Ademas,  podemos  demostrar 
teoricamente  que  la  misma  relation  se  cumple  para  los  valores  crfticos  de  las  tablas  z 
y  X  del  apendice  I,  que  produce  valores  p  identicos  para  las  dos  pruebas  equivalentes. 
Para  probar  una  hipotesis  alternativa  de  una  cola  como  H0  :  pi  >  p2,  primero  se  deter- 
mina  si  pi  —  p2>  0,  es  decir,  si  la  diferencia  en  proporciones  muestrales  tiene  el  signo 
apropiado.  Si  es  asf,  el  valor  crftico  apropiado  de  \2  de  la  tabla  5  tendra  un  grado  de 
libertad  y  un  area  de  cola  derecha  de  2 a.  Por  ejemplo,  el  valor  crftico  X  con  1  dfy  a  = 
.05  sera  \2ia  =  2.70554  =  1.6452. 

En  resumen,  usted  es  libre  de  escoger  la  prueba  (z  o  X2)  que  sea  mas  comoda.  Como 
casi  todos  los  paquetes  de  computadora  incluyen  la  prueba  ji  cuadrada  y  la  mayor  parte 
de  ellos  no  incluyen  las  pruebas  z  de  muestra  grande,  la  prueba  ji  cuadrada  puede  ser 
preferible. 


OTRAS  APLICACIONES  DE  LA  PRUEBA 
JI  CUADRADA 

La  aplicacion  de  la  prueba  ji  cuadrada  para  analizar  datos  de  cantidades  es  solo  uno  de  mu- 
chos  problemas  de  clasihcacion  que  resultan  en  datos  multinomiales.  Algunas  de  estas 
aplicaciones  son  bastante  complejas,  requiriendo  procedimientos  complicados  o  diffci- 
les  desde  el  punto  de  vista  de  calculos  para  estimar  las  cantidades  de  celda  esperadas.  No 
obstante,  varias  aplicaciones  se  utilizan  con  subciente  frecuencia  para  hacerlas  dignas 
de  mention: 


•  Pruebas  de  bondad  del  ajuste:  Se  puede  disenar  una  prueba  de  bondad  de 
ajuste  para  determinar  si  los  datos  son  consistentes  con  datos  tornados  de  una 
distribucion  particular  de  probabilidad,  posiblemente  normal,  binomial,  de  Pois¬ 
son  u  otras  distribuciones.  Las  celdas  de  un  histograma  de  frecuencia  muestral 
corresponden  a  las  k  celdas  de  un  experimento  multinomial.  Las  cantidades  espe¬ 
radas  de  celda  se  calculan  usando  las  probabilidades  asociadas  con  la  distribucion 
hipotetica  de  probabilidad. 

•  Multinomiales  dependientes  del  tiempo:  Se  puede  usar  el  estadfstico  ji  cua¬ 
drada  para  investigar  la  rapidez  de  cambio  de  proporciones  multinomiales  (o 
binomiales)  en  el  tiempo.  Por  ejemplo,  suponga  que  la  proporcion  de  respuestas 
correctas  en  un  examen  de  100  preguntas  se  registra  para  un  estudiante,  que 
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entonces  repite  el  examen  en  cada  una  de  las  siguientes  4  semanas.  ^La  propor- 
cion  de  respuestas  correctas  aumenta  con  el  tiempo?  (',Esta  teniendo  lugar  un 
aprendizaje?  En  un  proceso  monitoreado  por  un  plan  de  control  de  calidad,  ^liay 
una  tendencia  positiva  en  la  proporcion  de  artfculos  defectuosos  como  funcion 
del  tiempo? 

•  Tablas  de  contingencia  multidimensionales:  En  lugar  de  solo  dos  metodos 
de  clasificacion,  se  puede  investigar  una  dependencia  entre  tres  o  mas  clasifi- 
caciones.  La  tabla  de  contingencia  de  dos  vfas  se  extiende  a  una  tabla  en  mas 
de  dos  dimensiones.  La  metodologfa  es  similar  a  la  que  se  emplea  para  la 
tabla  de  contingencia  de  r  X  c,  pero  el  analisis  es  un  poco  mas  complejo. 

•  Modelos  log-lineales:  Modelos  complejos  se  pueden  crear  en  donde  el 
logaritmo  de  la  probabilidad  de  celda  (In  ptj)  es  alguna  funcion  lineal  de  las 
probabilidades  de  renglon  y  columna. 

Casi  todas  estas  aplicaciones  son  mas  bien  complejas  y  podrfan  requerir  el  consejo  de  un 
estadfstico  profesional  antes  de  realizar  un  experimento. 

En  todas  las  aplicaciones  estadfsticas  que  usen  estadistica  ji  cuadrada  de  Pearson,  las 
suposiciones  deben  estar  satisfechas  para  que  el  estadfstico  de  prueba  tenga  una  distribu¬ 
cion  de  probabilidad  ji  cuadrada  aproximada. 


SUPOSICIONES 

•  Las  cantidades  de  celda  (9,.  02,  ...,  Ok  deben  satisfacer  las  condiciones  de  un 
experimento  multinomial,  o  un  conjunto  de  experimentos  multinomiales  creados 
al  fijar  ya  sea  los  totales  de  renglon  o  de  columna. 

•  Las  cantidades  de  celda  esperadas  Eh  E-,,  E,  deben  ser  iguales  o  mayores  a  5. 

Por  lo  general  se  puede  estar  razonablemente  seguro  de  haber  satisfecho  la  primera 
suposicion  si  con  todo  cuidado  se  prepara  o  disena  un  experimento  o  encuesta  muestral. 
Cuando  calcule  las  cantidades  de  celda  esperadas,  si  encuentra  que  una  o  mas  es  menor 
a  5,  existen  estas  opciones: 

•  Escoja  un  tamano  n  muestral  mas  grande.  Cuanto  mas  grande  sea  el  tamano 
muestral,  mas  cerca  se  aproximara  la  distribucion  cuadrada  a  la  distribucion 
de  su  estadfstico  de  prueba  X2. 

•  Puede  ser  posible  combinar  una  o  mas  de  las  celdas  con  pequenas  cantidades 
de  celda  esperadas,  con  lo  cual  se  satisface  la  suposicion. 

Por  ultimo,  asegurese  de  estar  calculando  los  grados  de  libertad  correctamente  y 
que  con  todo  cuidado  se  evaluan  las  conclusiones  estadfsticas  y  practicas  que  se  pueden 
sacar  de  la  prueba. 


REPASO  DEL  CAPITULO 


Conceptos  y  formulas  clave 

I.  El  experimento  multinomial 

1 .  Hay  n  intentos  identicos  y  cada  resultado  cae  en 
una  de  k  categorfas. 

2.  La  probabilidad  de  caer  en  la  categorfa  i  es  pl  y 
permanece  constante  de  un  intento  a  otro. 


3.  Los  intentos  son  independientes,  Xp,  =  1,  y  medi- 
mos  <9„  el  numero  de  observaciones  que  caen  en 
cada  una  de  k  categorfas. 
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II.  Estadisticas  ji  cuadrada  de  Pearson 

^2  v(0«-£/)2  ,  ,  r- 

X  =  z - -  donde  £,  =  npt 

que  es  una  distribution  ji  cuadrada  aproximada  con 

grados  de  libertad  determinados  por  la  aplicacion. 

III.  La  prueba  de  bondad  del  ajuste 

1 .  Esta  es  una  clasificacion  de  una  via  con  probabili- 
dades  de  celda  especificadas  en  H0. 

2.  Use  el  estadlstico  ji  cuadrada  con  =  np:  calcu- 

lada  con  las  probabilidades  hipoteticas. 

3.  df  =  k  —  1  —  (Numero  de  parametros  estimados 
para  hallar  Et) 

4.  Si  H0  es  rechazada,  investigue  la  naturaleza  de  las 
diferencias  usando  las  proporciones  muestrales. 

IV.  Tablas  de  contingencia 

1.  Una  clasificacion  de  dos  vfas  con  n  observaciones 
en  categories  derXc  celdas  de  una  tabla  de  dos 
vfas,  que  usa  dos  metodos  diferentes  de  clasifica¬ 
cion,  se  denomina  tabla  de  contingencia. 

2.  La  prueba  de  independencia  de  metodos  de  clasi¬ 
ficacion  usa  el  estadlstico  ji  cuadrada 

x*  =  JQizM 

Eij 

con  E<j  =  ~  y  df  =  (r  -  l)(c  -  1) 


3.  Si  la  hipotesis  nula  de  independencia  de  clasifica- 
ciones  se  rechaza,  investigue  la  naturaleza  de 
la  dependencia  usando  proporciones  condicio- 
nales  dentro  de  ya  sea  renglones  o  columnas  de  la 
tabla  de  contingencia. 

V.  Fijar  totales  de  renglon  o  columna 

1 .  Cuando  sea  que  los  totales  de  renglon  o  los  de 
columna  sean  fijos,  la  prueba  de  independencia 
de  clasificaciones  se  convierte  en  una  prueba  de 
la  homogeneidad  de  probabilidades  de  celda  para 
varios  experimentos  multinominales. 

2.  Use  el  mismo  estadlstico  ji  cuadrada  que  para 
tablas  de  contingencia. 

3.  Las  pruebas  Z  de  muestra  grande  para  uno  y  dos 
proporciones  binomiales  son  casos  especiales  de 
la  estadlstica  ji  cuadrada. 

VI.  Suposiciones 

1 .  Las  cantidades  de  celda  satisfacen  las  condiciones 
de  un  experimento  multinomial  o  un  conjunto  de 
experimentos  con  tamanos  muestrales  fijos. 

2.  Todas  las  cantidades  de  celda  esperadas  deben  ser 
iguales  o  mayores  a  cinco  para  que  la  aproxima- 
cion  ji  cuadrada  sea  valida. 


La  prueba  ji  cuadrada 


Existen  varios  procedimientos  en  el  paquete  MINITAB  para  analizar  datos  categoricos. 
El  procedimiento  apropiado  depende  de  si  los  datos  representan  una  clasificacion  de 
una  via  (un  solo  experimento  multinomial)  o  una  clasificacion  de  dos  vlas  o  tabla 
de  contingencia.  Si  los  datos  categoricos  sin  elaborar  se  han  guardado  en  la  hoja  de  tra- 
bajo  MINITAB  mas  que  las  cantidades  de  celda  observadas,  puede  ser  necesario  totalizar 
o  clasificar  en  cruz  los  datos  para  obtener  las  cantidades  de  celda  antes  de  continuar. 

Por  ejemplo,  supongamos  que  se  ha  registrado  el  genero  (M  o  F)  y  el  estatus  universi- 
tario  (ler  ano,  2o.  ano,  no  graduado,  de  ultimo  ano,  egresado)  para  100  estudiantes  de  es¬ 
tadlstica.  La  hoja  de  trabajo  MINITAB  contendrfa  dos  columnas  de  100  observaciones 
cada  una.  Cada  renglon  contendrfa  el  genero  de  una  persona  en  la  columna  1  y  el  esta¬ 
tus  universitario  en  la  columna  2.  Para  obtener  las  cantidades  de  celda  observadas  (0„) 
para  la  tabla  de  contingencia  2X5,  use  Stat  — »  Tables  — »  Cross  Tabulation  and  Chi- 
Square  para  generar  el  cuadro  de  dialogo  que  se  ve  en  la  figura  14.6. 

Bajo  “Categorical  Variables”,  seleccione  “Gender”  para  la  variable  de  renglon  y 
“Status”  para  la  variable  de  columna.  Deje  las  cajas  marcadas  “For  Layers”  y  “Frequen- 
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cies  are  in:”  en  bianco.  Asegurese  que  el  cuadro  con  leyenda  “Display  Counts”  tenga 
marca  de  activado.  De  un  clic  en  el  boton  Chi-Square...  para  exhibir  el  cuadro  de  dialo- 
go  de  la  figura  14.6.  Seleccione  las  cajas  para  “Chi-Square  Analysis”  y  “Expected  Cell 
Counts”.  De  doble  clic  en  OK.  Esta  secuencia  de  comandos  no  solo  tabula  la  tabla  de 
contingencia,  sino  que  tambien  realiza  la  prueba  ji  cuadrada  de  independencia  y  exhibe 
los  resultados  en  la  ventana  Session  que  se  ve  en  la  figura  14.7.  Para  los  datos  del  estatus 
genero/universidad,  el  valor  p  grande  (P  =  .153)  indica  un  resultado  no  significativo. 
Hay  suficiente  evidencia  para  indicar  que  el  genero  de  un  estudiante  depende  del  estatus 
de  clase. 

Si  las  cantidades  de  celda  observadas  en  la  tabla  de  contingencia  ya  han  sido  tabula- 
das,  simplemente  introduzca  las  cantidades  en  las  columnas  c  de  la  hoja  de  trabajo  MINI¬ 
TAB,  use  Stat  — »  Tables  — >  Chi-Square  Test  (Two-Way  Table  in  Worksheet)  y  selec¬ 
cione  las  columnas  apropiadas  antes  de  dar  clic  en  OK.  Para  los  datos  del  estatus  genero/ 
universidad,  se  pueden  introducir  las  cantidades  en  las  columnas  C3-C7  como  se  ve 
en  la  figura  14.8.  La  salida  impresa  resultante  tendra  una  leyenda  diferente  pero  se  vera 
exactamente  como  la  salida  impresa  de  la  figura  14.7. 

Una  prueba  sencilla  de  un  solo  experimento  multinomial  se  puede  iniciar  al  conside- 
rar  si  las  proporciones  de  estudiantes  de  estadfstica  hombres  y  mujeres  son  iguales,  es 
decir,  px  =  .5  y  p2  =  .5. 

En  MINITAB  15,  use  Stat  — »  Tables  — »  Chi-Square  Goodness-of-Fit  Test  (One  Va¬ 
riable)  para  exhibir  el  cuadro  de  dialogo  de  la  figura  14.9.  Si  usted  tiene  datos  categori- 
cos  sin  elaborar  en  una  columna,  de  un  clic  en  el  boton  “Categorical  data:”  e  introduzca 
la  columna  “Gender”  en  la  celda.  Si  tiene  valores  de  resumen  de  cantidades  observadas 
para  cada  categorfa,  escoja  “Observed  counts”.  A  continuation  introduzca  las  cantida¬ 
des  observadas  o  teclee  las  cantidades  observadas  para  cada  categorfa. 

Para  esta  prueba,  podemos  seleccionar  “Equal  proportions”  para  probar  H0  :  px  = 
p2  =  .5.  Cuando  tenga  proporciones  diferentes  para  cada  categorfa,  use  “Specific  propor- 
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FIGURA  14.7 
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FIGURA  14.8 


tions”.  Puede  guardar  las  proporciones  para  cada  categorfa  en  una  columna,  escoger  “In¬ 
put  column”  e  introducir  la  columna.  Si  desea  teclear  la  proporcion  para  cada  categorfa, 
escoja  “Input  constantes”  y  teclee  las  proporciones  para  las  categorfas  correspondientes. 
De  un  clic  en  OK.  La  salida  resultante  incluira  varias  graficas  junto  con  los  valores  para 
O,  y  E,  para  cada  categorfa,  el  valor  observado  de  la  estadfstica  de  prueba,  X2=  1.44,  y 
su  valor  p  =  0.230,  que  no  es  significativo.  Hay  suficiente  evidencia  para  indicar  una 
diferencia  en  la  proporcion  de  estudiantes  de  estadfstica  hombres  y  mujeres. 
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Si  usted  emplea  una  version  previa  del  MINITAB,  tendra  que  determinar  las  cantidades 
de  celda  observadas  y  esperadas,  e  introducirlas  en  columnas  separadas  en  la  hoja  de  tra- 
bajo.  A  continuacion  use  Calc  — »  Calculator  y  la  expresion  SUM((‘0’  —  ‘E’)**2/‘E’) 
para  calcular  el  valor  observado  de  la  estadfstica  de  prueba. 


FIGURA  14.9 
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EJercicios  suplementarios 

Los  ejercicios  con  asterisco  (*)  son  opcionales. 

14.35  Cera  para  pisos  Un  fabricante  de  cera 
para  pisos  realizo  un  experimento  de  preferencia  del 
consumidor  para  ver  si  una  nueva  cera  para  pisos  A 
era  mejor  que  las  producidas  por  cuatro  competidores, 
B,  C,  D  y  E.  Una  muestra  de  cien  amas  de  casa  vieron 
cinco  parches  de  piso  que  habfa  recibido  las  cinco  ceras 
y  cada  una  indico  el  parche  que  consideraba  mejor  en 
apariencia.  La  iluminacion,  el  fondo  y  otros  factores 
eran  aproximadamente  iguales  para  los  cinco  parches. 
Los  resultados  del  estudio  se  ven  a  continuacion: 

Cera  ABODE 

Frecuencia  27  17  15  22  19 


^Los  datos  presentan  suhciente  evidencia  para  indicar 
una  preferencia  por  uno  o  mas  de  los  parches  pulidos  de 
piso  sobre  los  otros?  Si  uno  fuera  a  rechazar  la  hipotesis 
de  no  preferencia  para  este  experimento,  (umplicarfa  esto 
que  la  cera  A  es  mejor  que  las  otras?  ^Se  puede  sugerir 
una  mejor  forma  de  realizar  el  experimento? 

14.36  Buena  condicion  fisica  en  Estados 

Unidos  Se  realizo  un  estudio  para  investigar  el 
interes  de  adultos  de  edad  mediana  en  programas  de 
acondicionamiento  ffsico  en  Rhode  Island,  Colorado, 
California  y  Florida.  El  objetivo  de  la  investigacion  era 
determinar  si  la  participacion  de  adultos  en  programas  de 
acondicionamiento  ffsico  varfa  de  una  region  de  Estados 
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Unidos  a  otra.  Una  muestra  aleatoria  de  personas  fueron 
entrevistadas  en  cada  estado  y  se  registraron  estos  datos: 

Rhode  Island  Colorado  California  Florida 

Participan  46  63  108  121 

No  participan  149  178  192  179 

7,  Los  datos  indican  una  diferencia  en  participacion  de 
adultos  en  programas  de  acondicionamiento  ffsico 
de  un  estado  a  otro?  Si  es  asf,  describa  la  naturaleza  de 
las  diferencias. 

14.37  Accidentes  fatales  Se  analizaron  datos  de 
accidentes  para  determinar  los  numeros  de  accidentes 
fatales  para  automoviles  de  tres  tamanos.  Los  datos  de 
346  accidentes  son  como  sigue: 

Pequeno  Mediano  Grande 

Fatal  67  26  16 

No  fatal  128  63  46 

7,  Los  datos  indican  que  la  frecuencia  de  accidentes  fatales 
depende  del  tamano  de  automoviles?  Escriba  un  breve 
parrafo  que  describa  sus  resultados  estadfsticos  y  las 
implicaciones  practicas  de  estos. 

14.38  Medicos  y  pacientes  de  asistencia  medica 

gratuita  Se  realizo  un  experimento  para  investigar 
el  efecto  de  la  experiencia  general  en  hospital,  en  las 
actitudes  de  medicos  hacia  pacientes  de  asistencia  medica 
gratuita.  Una  muestra  aleatoria  de  50  medicos  que 
acababan  de  terminar  4  semanas  de  servicio  en  un  hospital 
general  y  50  medicos  que  no  las  habfan  terminado,  fueron 
clasificados  de  acuerdo  a  su  interes  por  pacientes  de 
asistencia  medica  gratuita.  Los  datos  se  ven  en  la  tabla. 
7,Estos  datos  dan  suficiente  evidencia  para  indicar  un 
cambio  en  “interes”  despues  de  la  experiencia  general  en 
hospital?  Si  es  asf,  describa  la  naturaleza  del  cambio. 
Servicio  en  hospital 

Sin  servicio 

en  hospital  Alto  Bajo  Total 

Bajo  27  5  32 

Alto  9  9  18 

Salida  impresa  parcial  MINITAB  para  el  ejercicio  14.38 

Prueba  ji  cuadrada:  alto,  bajo 

Chi-Sq  =  6.752,  DF  =  1,  P-Value  =  0.009 

(^)datos  14.39  Ensenanza  basada 

en  descubrimientos  Dos  profesores 
de  biologfa  se  propusieron  evaluar  los  efectos  de  la 
ensenanza  basada  en  descubrimientos,  en  compara- 
cion  con  el  metodo  de  ensenanza  estandar  basada  en 
lectura  en  el  laboratorio.13  El  metodo  estandar  basado 
en  lectura  dio  una  lista  de  instrucciones  a  seguir  en  cada 
paso  del  ejercicio  de  laboratorio,  mientras  que  el  metodo 


basado  en  descubrimientos  hizo  preguntas  en  lugar  de  dar 
instrucciones  y  utilizo  los  informes  de  un  pequeno  grupo 
para  decidir  la  mejor  forma  de  continuar  para  llegar  al 
objetivo  de  laboratorio.  Una  evaluacion  de  las  tecnicas 
comprendfa  evaluaciones  de  ambos  procedimientos  por 
estudiantes  al  final  del  curso.  La  comparacion  del  numero 
de  respuestas  positivas  y  negativas  para  ambas  tecnicas 
se  da  en  la  tabla  siguiente. 

Evaluaciones  Evaluaciones 

Grupo  positivas  negativas  Total 

Descubrimiento  37  11  48 

Control  31  17  48 

a.  qHay  una  diferencia  significativa  en  la  proportion 
de  respuestas  positivas  para  cada  uno  de  los 
metodos  de  ensenanza?  Use  a  =  .05.  Si  es  asf, 

(■como  describirfa  esta  diferencia? 

b.  7,  C  util  es  el  valor  p  aproximado  para  la  prueba  del 
inciso  a)? 

14.40  Posicion  de  un  bebe  dormido  7  La  posicion 
de  un  bebe  dormido  afecta  el  desarrollo  de  habilidades 
motoras?  En  un  estudio,  343  ninos  de  desarrollo  normal 
fueron  examinados  en  su  revision  de  4o.  mes  en  busca  de 
varios  aspectos  importantes  de  desarrollo,  por  ejemplo 
rodarse,  tomar  una  sonaja  o  alcanzar  un  objeto.14  La 
posicion  predominante  del  bebe  al  dormir,  ya  sea  boca 
abajo,  de  espaldas  o  de  costado,  fue  determinada  por  una 
entrevista  telefonica  con  los  padres.  Los  resultados  de  la 
muestra  de  320  de  los  343  bebes  de  quienes  se  recibio 
information  se  ven  en  la  tabla  siguiente.  El  investiga- 
dor  informo  que  los  bebes  que  dormfan  de  costado  o  boca 
arriba  eran  menos  susceptibles  de  rodarse  en  su  revision 
de  4o.  mes  que  los  que  dormfan  predominantemente  boca 
abajo  (P  <  .001). 

Boca  abajo  Boca  arriba  o  de  costado 

Numero  de  bebes  121  199 

Numero  que  se  rodaban  93  119 

a.  Use  una  prueba  z  de  muestra  grande  para  confirmar  o 
refutar  la  conclusion  del  investigador. 

b.  Reescriba  los  datos  de  la  muestra  como  una  tabla  de 
contingencia  de  2  X  2.  Use  la  prueba  ji  cuadrada  para 
homogeneidad  para  confirmar  o  refutar  la  conclusion 
del  investigador. 

c.  Compare  los  resultados  de  los  incisos  a)  y 

b).  Confirme  que  los  dos  estadfsticos  de  prueba 
estan  relacionadas  como  z  =  X3  y  que  los  valores 
crfticos  para  rechazar  H0  tienen  la  misma  relation. 

14.41  Consulte  el  ejercicio  14.40.  Encuentre  el  valor  k 
para  la  prueba  z  de  muestra  grande  del  inciso  a).  Compare 
este  valor  p  con  el  valor  p  para  la  prueba  ji  cuadrada, 
mostrada  en  la  salida  impresa  parcial  MINITAB. 
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Salida  impresa  parcial  MINITABpara  el  ejercicio  14.41 

Prueba  ji  cuadrada:  boca  abajo,  de  costado 

Chi-Sq  =  9.795,  DF  =  1,  P- Value  =  0.002 

14.42  Posicion  de  un  bebe  dormido  II  Los 

investigadores  en  el  ejercicio  14.40  tambien  midieron 
otros  varios  aspectos  del  desarrollo  y  sus  relaciones 
con  la  posicion  predominante  del  bebe  al  dormir.14  Los 
resultados  de  su  investigacion  se  presentan  en  la  tabla 
para  los  320  bebes  y  su  revision  de  4o.  mes. 


Aspecto 

Registro 

Boca  abajo 

Boca  arriba 

P 

Se  jala  para  sentarse 
sin  doblar  la  cabeza 

Aprueba 

79 

144 

No  aprueba 

6 

20 

<.21 

Toma  una  sonaja 

Aprueba 

102 

167 

No  aprueba 

3 

1 

<.13 

Alcanza  un  objeto 

Aprueba 

107 

183 

No  aprueba 

3 

5 

<.97 

Use  su  conocimiento  del  analisis  de  datos  categoricos 
para  explicar  el  diseno  experimental  empleado  por  los 
investigadores.  7,  Que  hipotesis  fueron  de  interes  para 
los  investigadores  y  que  prueba  estadfstica  hubieran 
usado  los  investigadores?  Explique  las  conclusiones  que 
se  puedan  sacar  de  los  tres  valores  p  en  la  ultima  columna 
de  la  tabla,  asf  como  las  implicaciones  practicas  que 
puedan  sacarse  de  los  resultados  estadfsticos.  (',Se  han 
violado  algunas  suposiciones  estadfsticas? 

14.43  Color  y  forma  de  una  flor  Un  botanico 
realiza  un  cruce  secundario  de  petunias  con  factores 
independientes  que  controlan  la  forma  de  hoja  y  color 
de  flor,  donde  el  factor  A  representa  el  color  rojo,  a 
representa  color  bianco,  B  representa  hojas  redondas  y 
b  representa  hojas  largas.  De  acuerdo  con  el  modelo  de 
Mendel,  las  plantas  deben  exhibir  las  caracterfsticas  AB, 
Ab,  aB  y  ab  en  la  proportion  9:3:3: 1.  De  160  plantas 
experimentales,  se  observaron  los  numeros  siguientes: 

AB  Ab  aB  ab 
95  30  28  7 

7  Hay  suficiente  evidencia  para  refutar  el  modelo  de 
Mendel  al  nivel  a  =  .01? 

14.44  Salmonella  7EI  pavo  de  su  fiesta  esta  bien? 

Un  “nuevo  estudio  federal  encontro  que  13%  de  los 
pavos  estan  contaminados  con  la  bacteria  salmonella 
responsable  de  1.3  millones  de  enfermedades  y  cerca 
de  500  fallecimientos  en  un  ano  en  Estados  Unidos”.15 
Use  la  tabla  que  sigue  para  determinar  si  hay  diferencia 
significativa  en  la  rapidez  de  contamination  en  tres 
plantas  de  procesamiento.  Cien  pavos  se  seleccionaron  al 
azar  de  cada  una  de  las  lfneas  de  procesamiento  en  estas 
tres  plantas. 


Planta 

Salmonella  presente 

Tamano  muestral 

1 

42 

100 

2 

23 

100 

3 

22 

100 

7  Hay  diferencia  significativa  en  la  rapidez  de  con¬ 
taminacion  por  salmonella  entre  estas  tres  plantas  de 
procesamiento?  Si  hay  una  diferencia  significativa, 
describa  la  naturaleza  de  estas  diferencias.  Use  a  =  .01. 

14.45  i/ledicina  para  la  artritis  Un  estudio  para 
determinar  la  efectividad  de  un  medicamento  (suero) 
para  la  artritis  resulto  en  la  comparacion  de  dos  grupos, 
cada  uno  formado  por  200  pacientes  de  artritis.  Un  grupo 
fue  inoculado  con  el  suero;  el  otro  recibio  un  placebo 
(inoculation  que  parece  contener  suero  pero  en  realidad 
no  es  activo).  Despues  de  un  tiempo,  a  cada  persona  del 
estudio  se  le  pidio  que  dijera  si  su  afeccion  de  artritis 
habfa  mejorado.  Estos  son  los  resultados: 

Tratado  Notratado 

Mejoro  117  74 

No  mejoro  83  126 

Se  desea  saber  si  estos  datos  presentan  suficiente 
evidencia  para  indicar  que  el  suero  fue  efectivo  para 
mejorar  la  condition  de  pacientes  de  artritis. 

a.  Use  la  prueba  ji  cuadrada  de  homogeneidad  para 
comparar  las  proporciones  mejoradas  de  las 
poblaciones  de  personas  tratadas  y  no  tratadas. 

Pruebe  al  nivel  de  significancia  de  5%. 

b.  Pruebe  la  igualdad  de  las  dos  proporciones  binomiales 
usando  la  prueba  z  de  dos  muestras  de  la  seccion 

9.6.  Verifique  que  el  valor  elevado  al  cuadrado  del 
estadfstico  de  prueba  z  =  X2  del  inciso  a).  7S11S 
conclusiones  son  iguales  a  las  del  inciso  a)? 

14.46  Estacionamiento  en  la  universidad  Se 
realizo  un  estudio  para  determinar  las  actitudes  de 
estudiantes,  profesores  y  personal  administrativo 
acerca  de  la  nueva  polftica  de  estacionamiento  en  la 
universidad.  La  distribution  de  quienes  estan  a  favor  o 
en  contra  de  esa  polftica  se  muestra  en  la  tabla  siguiente. 
7,Los  datos  dan  suficiente  evidencia  para  indicar  que  las 
actitudes  acerca  de  la  polftica  de  estacionamiento  son 
independientes  del  estatus  de  estudiantes,  profesores  o 


personal  administrativo? 

Estudiantes 

Profesores 

Administracion 

A  favor 

252 

107 

43 

Se  oponen 

139 

81 

40 

14.47*  La  prueba  ji  cuadrada  empleada  en  el  ejerci¬ 
cio  14.45  es  equivalente  a  la  prueba  z  de  dos  colas  de  la 
seccion  9.6  siempre  que  a  sea  igual  para  las  dos  pruebas. 
Demuestre  algebraicamente  que  el  estadfstico  X2  de  la 
prueba  ji  cuadrada  es  el  cuadrado  de  la  prueba  estadfstica 
Z  para  la  prueba  equivalente. 
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14.48  Ajuste  de  una  distribucion  binomial  Se 

puede  usar  una  prueba  de  bondad  de  ajuste  para  de- 
terminar  si  en  realidad  todos  los  criterios  para  un 
experimento  binomial  se  han  satisfecho  en  una  aplicacion 
determinada.  Suponga  que  un  experimento  consistente 
en  cuatro  intentos  se  repitio  cien  veces.  El  niimero  de 
repeticiones  en  las  que  se  obtuvo  un  numero  dado 
de  exitos  y  se  registro  en  la  tabla: 

Resultados  posibles  Numero  de  veces 

(numero  de  exitos)  obtenido 

0  11 

1  17 

2  42 

3  21 

4  9 

Estime  p  (suponiendo  que  el  experimento  fue  binomial), 
obtenga  estimaciones  de  las  frecuencias  de  celda 
esperadas  y  pruebe  la  bondad  del  ajuste.  Para  determinar 
el  numero  apropiado  de  grados  de  libertad  para  X2, 
observe  que  p  fue  estimado  por  una  combination  lineal 
de  las  frecuencias  observadas. 

14.49  Antibioticos  e  infeccion  A  veces  ocurren 
infecciones  cuando  se  aplican  transfusiones  de  sangre 
durante  operaciones  quirurgicas.  Se  realizo 

un  experimento  para  determinar  si  la  inyeccion 
de  anticuerpos  redujo  la  probabilidad  de  infeccion.  Un 
examen  de  los  registros  de  138  pacientes  produjo  los 
datos  que  se  ven  en  la  tabla  siguiente.  ^Los  datos  dan 
suficiente  evidencia  para  indicar  que  inyecciones  de 
anticuerpos  afectan  la  probabilidad  de  infecciones  en 
transfusiones?  Pruebe  usando  a  =  .05. 

Infeccion  No  infeccion 

Anticuerpos  4  78 

Sin  anticuerpos  11  45 

14.50  Manufactura  alemana  Los  sindicatos 
de  Estados  Unidos  han  estado  tradicionalmente 
contentos  con  dejar  la  administration  de  companfas  a 
gerentes  y  ejecutivos  corporativos.  Pero,  en  Europa,  la 
participacion  de  los  trabaj  adores  en  la  toma  de  decisiones 
administrativas  es  una  idea  aceptada  que  se  esta 
extendiendo  en  forma  continua.  Para  estudiar  el  efecto  de 
la  participacion  de  trabajadores  en  la  toma  de  decisiones 
administrativas,  cien  trabajadores  fueron  entrevistados 
en  cada  una  de  dos  plantas  manufactureras  alemanas. 

Una  de  ellas  tenia  participacion  activa  de  trabajadores 

en  la  toma  de  decisiones  administrativas;  la  otra,  no.  A 
cada  trabaj  ador  seleccionado  se  le  pregunto  si  en  general 
aprobaba  las  decisiones  administrativas  tomadas  dentro 
de  la  firma.  Los  resultados  de  las  entrevistas  se  muestran 
en  la  tabla  siguiente: 


Participacion  No  participacion 

Generalmente  aprueban  73  51 

No  aprueban  27  49 

a.  (-.Los  datos  dan  evidencia  suficiente  para  indicar 
que  la  aprobacion  o  desaprobacion  de  decisiones 
administrativas  depende  de  si  los  trabajadores 
participan  en  la  toma  de  decisiones?  Pruebe  usando 
la  estadistica  de  prueba  X2.  Use  a  =  .05. 

b.  (:,Estos  datos  apoyan  la  hipotesis  de  que  trabajadores 
de  una  firma,  con  toma  de  decisiones  participativa, 
aprueban  mas  generalmente  las  decisiones 
administrativas  de  la  firma  que  los  empleados  sin  toma 
de  decisiones  participativas?  Pruebe  usando  la  prueba 
Z  presentada  en  la  section  9.6.  Este  problema  requiere 
una  prueba  de  una  cola.  (jPor  que? 

14.51  Tresentradas  Un  estudio  de  transito  de 
ocupantes  se  realizo  para  ayudar  en  la  remodelacion 
de  un  edificio  de  oficinas  que  contiene  tres  entradas. 

La  seleccion  de  entrada  se  registro  para  una  muestra  de 
200  personas  que  entraron  al  edificio.  ^Los  datos  de  la 
tabla  indican  que  hay  una  diferencia  en  preferencia  para 
las  tres  entradas?  Encuentre  un  intervalo  de  confianza  de 
95%  para  la  proportion  de  personas  que  estan  a  favor 
de  la  entrada  1 . 

Entrada  1  2  3 

Numero  que  entran  83  61  56 

14.52  Maestros  de  escuela  en  casa  Los  padres, 
preocupados  por  el  ambiente  en  escuelas  publicas  y  por 
antecedentes,  estan  mirando  hacia  la  escuela  en  casa  para 
controlar  el  contenido  y  atmosfera  de  los  ambien- 

tes  de  aprendizaje  de  sus  hijos.  Aun  cuando  el  empleo 
como  profesor  de  escuela  publica  requiere  de  un  tftulo 
de  licenciatura  en  educacion  o  una  materia  del  area,  el 
antecedente  educacional  de  profesores  en  casa  es  muy 
variado.  El  antecedente  educativo  de  una  muestra  de 
n  =  500  padres  que  participan  en  educar  a  sus  hijos 
en  2003  aparece  en  la  tabla  que  sigue,  junto  con  los 
correspondientes  porcentajes  de  pares  que  ensenaron  a  sus 
hijos  en  1999.  Los  niveles  de  educacion  para  ciudadanos 
estadounidenses  en  general  se  dan  en  la  segunda  tabla. 


Educacion  de  padres 

2003 

Porcentajes 

1999 

Preparatoria  0  menos 

121 

18.9 

Universidad/tecnica  no  conciuida 

153 

33.7 

Tftulo  de  licenciatura 

127 

25.1 

Graduado/profesional 

99 

22.3 

Nivel  educativo 

%  de  poblacion  de  Estados  Unidos 

2009 

Secundaria  0  menos  47.5 

Algun  nivel  de  bachillerato  25.3 

Grado  universitario  0  mas  27.2 
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a.  /.Hay  un  cambio  significative)  en  los  antecedentes 
educativos  de  padres  que  ensenaron  a  sus  hijos  en 
2003,  en  comparacion  con  2009?  Use  a  =  .01. 

b.  Si  hay  un  cambio  significativo  en  antecedentes 
educativos  de  estos  padres,  /.como  se  describirfa  ese 
cambio? 

c.  Usando  la  segunda  tabla,  /.podemos  determinar  si 
profesores  de  escuela  en  casa  tienen  los  mismos 
antecedentes  educativos  que  la  poblacion  de  Estados 
Unidos  en  general?  Si  no  es  asi,  /cuales  grupos  estan 
representados  de  menos  y  cuales  de  mas? 

14.53  ^Es  usted  un  buen  automovilista?  /  Como 
se  calificarfa  usted  mismo  como  conductor?  De  acuerdo  a 
un  estudio  realizado  por  el  Field  Institute,  la  mayorfa  de 
californianos  piensan  que  son  buenos  conductores  pero 
tienen  poco  respeto  por  la  pericia  de  otros  conductores. 
Los  datos  muestran  la  distribution  de  opiniones  de 
acuerdo  al  genero  para  dos  cuestiones  diferentes,  la 
primera  calificandose  a  si  mismos  como  conductores  y 

la  segunda  calificando  a  otros  como  conductores.17  Aun 
cuando  no  se  indica  en  la  fuente,  suponemos  que  hubo 
cien  hombres  y  cien  mujeres  en  el  grupo  encuestado. 

Se  califica  como  conductor 

Genero  Excelente  Bueno  Regular 

Hombre  43  48  9 

Mujer  44  53  3 

Califica  a  otros  como  conductores 

Genero  Excelente  Bueno  Regular  Malo/Muy  Malo 

Hombre  4  42  41  13 

Mujer  3  48  35  14 

a.  /.Hay  suficiente  evidencia  para  indicar  que  hay 
diferencia  en  las  calificaciones  propias  entre  hombres 
y  mujeres  automovilistas?  Encuentre  el  valor  p 
aproximado  para  la  prueba. 

b.  /.Hay  suficiente  evidencia  para  indicar  que  hay  una 
diferencia  en  las  calificaciones  de  otros  automovilistas 
entre  hombres  y  mujeres?  Encuentre  el  valor  p 
aproximado  para  la  prueba. 

c.  /.Ha  sido  violada  alguna  suposicion  necesaria  para 
el  analisis  usado  en  los  incisos  a)  y  b)?  /.Que  efecto 
podria  tener  esto  en  la  validez  de  sus  conclusiones? 

14.54  Colores  de  vehi'culos  Cada  modelo  parece 
introducir  nuevos  colores  y  tonos  diferentes  para  una 
amplia  variedad  de  vehiculos,  desde  autos  de  lujo,  autos 
grandes  o  modelos  intermedios,  hasta  compactos  y 
autos  deportivos,  asi  como  para  camiones  ligeros.  No 
obstante,  el  color  bianco  y  plateado/gris  siguen  siendo  los 


cinco  o  seis  colores  principales  en  todas  estas  categories 
de  automoviles.  Los  cinco  colores  principales  y  el 
porcentaje  de  su  participation  en  el  mercado  para  autos 
compactos/deportivos  se  muestra  en  la  tabla  siguiente.18 

Color  Plateado  Gris  Azul  Negro  Blanco/perla 

Porcentaje  20  17  16  14  10 

Para  verificar  las  cifras,  se  tomo  una  muestra  aleatoria 
formada  por  250  autos  compactos/deportivos  y  se  registro 
el  color  de  los  vehiculos.  La  muestra  dio  las  siguientes 
cantidades  para  las  categories  dadas  lineas  antes:  60,  51, 
43,  35  y  30,  respectivamente. 

a.  /.Falta  alguna  categoria  en  la  clasificacion?  /.Cuantos 
vehiculos  pertenecen  a  esa  categoria? 

b.  /.Hay  suficiente  evidencia  para  indicar  que  nuestros 
porcentajes  de  autos  compactos/deportivos  difieren  de 
los  dados?  Encuentre  el  valor  p  aproximado  para  la 
prueba. 

14.55  Tarjetas  divertidas  Cuando  se  escoge 
una  tarjeta  de  visita,  /.siempre  se  busca  una  tarjeta 
humorfstica  o  esto  depende  de  la  ocasion?  Una 
comparacion,  patrocinada  por  dos  de  los  principales 
fabricantes  de  tarjetas  de  visita,  indicaba  una  ligera 
diferencia  en  las  proporciones  de  disenos  humoristicos 
hechos  para  tres  ocasiones  diferentes:  dia  del  padre, 
dia  de  la  madre  y  dia  de  san  Valentin.19  Para  probar  la 
precision  de  la  comparacion,  muestras  aleatorias  de  500 
tarjetas  de  visita  compradas  en  una  tienda  local,  en  la 
semana  antes  de  cada  dia  feriado,  se  introdujeron  en 
la  base  de  datos  de  una  computadora  y  se  obtuvieron  los 
resultados  de  la  tabla  siguiente.  /.Los  datos  indican  que 
las  proporciones  de  tarjetas  de  visita  humoristicas  varian 
para  esos  tres  dias  feriados?  (sugerencia:  Recuerde 
incluir  una  tabulacion  para  las  1500  tarjetas  de  visita.) 

Dia  feriado  Dia  del  padre  Dia  de  la  madre  Dia  de  san  Valentin 

Porcentaje  humor  20  25  24 

(^)datos  14.56  Medicina  que  sabe  bien  Pfizer 

Canada  Inc.  es  una  empresa  farmaceutica  que 
hace  acitromicina,  antibiotico  en  suspension  con  sabor 
a  cereza,  que  se  usa  para  tratar  infecciones  bacterianas 
en  ninos.  Para  comparar  el  sabor  de  su  producto  con 
tres  medicamentos  de  la  competencia,  Pfizer  probo  50 
ninos  sanos  y  20  adultos  sanos.  Entre  otras  medidas  para 
probar  el  sabor,  registraron  el  numero  de  probadores 
que  calificaron  cada  una  de  las  cuatro  suspensiones  de 
antibiotico  como  el  de  mejor  sabor.70  Los  resultados  se 
muestran  en  la  tabla  siguiente.  /.Hay  diferencia  en  la 
perception  del  mejor  sabor  entre  adultos  y  ninos?  Si  es 
asi,  /.cual  es  la  naturaleza  de  la  diferencia  y  por  que  es  de 
importancia  practica  para  la  compania  farmaceutica? 
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Sabor  de  antibiotico 

Banana  Cereza*  Fruta  silvestre  Strawberry-Banana 

Ninos  14  20  7  9 

Adultos  4  14  0  2 

*  Acitromicina  producida  por  Pfizer  Canada  Inc. 

(^datos  14.57  Lesiones  en  rugby  Las  lesiones 
en  rodillas  son  un  problema  importante  para 
atletas  en  muchos  deportes  de  contacto.  No  obstante, 
los  atletas  que  juegan  ciertas  posiciones  son  mas 
propensos  a  sufrir  lesiones  en  rodillas  que  otros  jugadores 
y  sus  lesiones  tienden  a  ser  mas  severas.  La  prevalencia  y 
patrones  de  lesiones  en  rodillas  entre  jugadoras  de  rugby 
universitarias  se  investigaron  usando  un  cuestionario  de 
muestra,  al  que  respondieron  42  clubs  de  rugby.21  Un 
total  de  76  lesiones  de  rodilla  fueron  clasificadas  por  tipo 
y  posicion  del  jugador  (delantero  o  defensa). 

Tipo  de  lesion  de  rodilla 

Desgarre  Desgarre  Desgarre  Desgarre  Desgarre 

Posicion  de  menisco  MCL  ACL  de  rotula  PCL 

Delantero  13  14  7  3  1 

Defensa  12  9  14  2  1 

Salida  impresa  MINITAB  para  el  ejercicio  14.57 

Prueba  ji  cuadrada:  desgarre  en  hombres,  desgarre 
MCL,  desgarre  ACL,  rotula,  desgarre  PCL 


Expected  counts  are  printed  below  observed  counts 
Chi-Square  contributions  are  printed  below  expected 
counts 


Men  Tear 

MCL  Tear 

ACL  Tear 

Patella 

PCL  Tear 

Total 

1 

13 

14 

7 

3 

1 

38 

12.50 

11.50 

10.50 

2.50 

1 . 00 

0.020 

0.543 

1.167 

0.100 

0 . 000 

2 

12 

9 

14 

2 

1 

38 

12.50 

11 . 50 

10.50 

2.50 

1 . 00 

0.020 

0.543 

1.167 

0.100 

0.000 

Total 

25 

23 

21 

5 

2 

76 

Chi-Sq  =  3.660,  DF  =  4 ,  P-Value  =  0.454 

4  cells  with  expected  counts  less  than  5.0 

a.  Use  la  salida  impresa  MINITAB  para  determinar  si 
hay  diferencia  en  la  distribucion  de  tipos  de  lesiones 
para  delanteros  y  defensas  de  rugby. H a  sido 
violada  alguna  suposicion  necesaria  para  la  prueba  ji 
cuadrada?  i Que  efecto  tendra  esto  en  la  magnitud  de 
la  estadistica  de  prueba? 

b.  Los  investigadores  informan  de  una  diferencia 
significativa  en  la  proporcion  de  los  desgarres  del 
MCL  para  las  dos  posiciones  ( P  <  .05)  y  una 
diferencia  significativa  en  la  proporcion  de  desgarres 
del  ACL  (P  <  .05),  pero  indican  que  todas  las  otras 
lesiones  ocurren  con  igual  frecuencia  para  las  dos 


posiciones.  ^Esta  de  acuerdo  con  esas  conclusiones? 
Explique. 

(^)datos  14.58  Comida  rapida  favorita  El  numero 
de  estadounidenses  que  con  regularidad  van 
a  restaurantes  de  comida  rapida  ha  crecido  en  forma 
constante  en  la  ultima  decada.  Por  esta  razon,  expertos  en 
marketing  estan  interesados  en  la  demogmfia  de  clientes 
de  comida  rapida.  ^La  preferencia  de  un  consumidor 
por  una  cadena  de  comida  rapida  es  afectada  por  la  edad 
del  consumidor?  Si  es  asi,  puede  que  sea  necesario  que 
la  publicidad  se  dirija  a  un  grupo  particular  de  edad. 
Suponga  que  se  selecciona  una  muestra  aleatoria  de 
500  consumidores  de  comida  rapida,  de  16  anos  o  mas, 
registrandose  sus  restaurantes  favoritos  de  comida  rapida 
junto  con  sus  grupos  de  edad,  como  se  ve  en  la  tabla: 


Grupo  de  edad 

McDonald's 

Burger  King 

Wendy's 

Otros 

16-21 

75 

34 

10 

6 

21-30 

89 

42 

19 

10 

30-49 

54 

52 

28 

18 

50+ 

21 

25 

7 

10 

Use  un  metodo  apropiado  para  determinar  si  la 
preferencia  de  un  consumidor  de  comida  rapida  depende 
o  no  de  la  edad.  Escriba  un  breve  parrafo  presentando  sus 
conclusiones  estadfsticas  y  sus  implicaciones  practicas 
para  los  expertos  en  mercadotecnia. 

14.59  Pescar  un  resfriado  ^La  probabilidad 
de  contraer  un  resfriado  esta  influida  por  el  numero  de 
contactos  sociales  que  tenga?  Un  estudio  reciente 
de  Sheldon  Cohen,  profesor  de  psicologia  de  la 
Universidad  Carnegie  Mellon,  parece  mostrar  que 
cuantas  mas  relaciones  sociales  tenga  alguien,  memos 
susceptible  es  a  los  resfriados.22  Un  grupo  de  276 
hombres  y  mujeres  sanos  se  agruparon  de  acuerdo  a  su 
numero  de  relaciones  (padres,  amigos,  miembros  de  la 
iglesia,  vecinos).  Se  les  expone  entonces  a  un  virus  que 
causa  los  resfriados.  Una  adaptacion  de  los  resultados  se 
muestra  en  la  tabla. 

Numero  de  relaciones 

Tresomenos  Cuatroocinco  Seis  o  mas 

Resfriado  49  43  34 

No  resfriado  31  57  62 

Total  80  100  96 

a.  7,  Los  datos  dan  suficiente  evidencia  para  indicar 
que  la  susceptibilidad  a  resfriados  es  afectada  por  el 
numero  de  relaciones  que  se  tenga?  Pruebe  al  nivel  de 
significancia  de  5%. 


www.FreeLibros.me 


626  O  CAPITULO  14  anAlisis  de  datos  categoricos 


b.  Con  base  en  los  resultados  del  inciso  a),  describa 
la  naturaleza  de  la  relacion  entre  las  dos  variables 
categoricas:  incidencia  de  resfriado  y  numero  de 
relaciones  sociales.  (',Sus  observaciones  concuerdan 
con  las  conclusiones  del  autor? 

(^)datos  14.60  Delincuencia  y  aprovechamiento 
EX1490  educativo  Un  criminalista  que  estudia 
delincuentes  con  un  record  de  uno  o  mas  arrestos,  esta 
interesado  en  saber  si  el  nivel  de  aprovechamiento 
educativo  del  transgresor  influye  en  la  frecuencia  de 
arrestos.  Ha  clasificado  estos  datos  usando  cuatro 
clasificaciones  de  nivel  educativo: 

A:  completo  6o.  grado  o  menos 
B:  completo  7o.,  8o.  o  9o.  grados 
C:  completo  10o.,  llo.  o  12o.  grados 
D:  educacion  mas  del  12o.  grado 

La  tabla  de  contingencia  muestra  el  numero  de 
transgresores  en  cada  categorfa  de  educacion,  junto 
con  el  numero  de  veces  que  han  sido  arrestados. 


Aprovechamiento  educativo 


Numero  de  arrestos 

A 

B 

C 

D 

1 

55 

40 

43 

30 

2 

15 

25 

18 

22 

3  o  mas 

7 

8 

12 

10 

(',Los  datos  presentan  suficiente  evidencia  para  indicar 
que  el  numero  de  arrestos  depende  del  aprovechamiento 
educativo  de  un  delincuente?  Pruebe  usando  a  =  .05. 

14.61  Mas  negocio  los  fines  de  semana  La 

gerente  de  una  tienda  de  departamentos  dice  que  su 
tienda  tiene  el  doble  de  clientes  los  viernes  y  sabados 
que  cualquier  otro  dfa  de  la  semana  (que  cierra  los 
domingos).  Esto  es,  la  probabilidad  de  que  un  cliente 
visite  la  tienda  en  viernes  es  2/8,  la  probabilidad  que 
un  cliente  visite  la  tienda  un  sabado  es  2/8,  en  tanto 
que  la  probabilidad  de  que  un  cliente  visite  la  tienda 
en  cada  uno  de  los  dfas  de  la  semana  restantes  es  1/8. 
Durante  una  semana  promedio,  los  numeros  siguientes  de 
clientes  visitaron  la  tienda: 

Dia  Numero  de  clientes 

Lunes  95 

Martes  110 

Miercoles  125 

Jueves  75 

Viernes  181 

Sabado  214 

(■.Puedc  ser  refutada  la  gerente  al  nivel  de  significancia  de 
a  =  .05? 
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m  APPLET  icios 

14.62  Use  el  applet  Chi-Square  Probabilities  para 
hallar  el  valor  de  x  con  la  siguiente  area  a  a  su  derecha: 
a.  a  =  .05,  df  =  15  b.  a  =  .01,  df=  11 

14.63  Use  el  applet  Chi-Square  Probabilities  para 
hallar  la  region  de  rechazo  para  una  prueba  ji  cuadrada  de 
probabilidades,  especificada  para  una  prueba  de  bondad 
de  ajuste  que  contenga  k  categorfas  para  los  siguientes 
casos: 

a.  k  =  14,  a  =  .005  b.  A:  =  3,  a  =  .05 

14.64  Use  el  applet  Chi-Square  Probabilities  para 
calcular  el  valor  p  para  las  siguientes  pruebas  ji  cuadrada: 
a.  X2  =  .81,  df  =  3  b.X2  =  25.40,  df=  13 

14.65  Trescientas  personas  fueron  encuestadas  y  se  les 
pidio  seleccionaran  su  marca  preferida  de  computadora 
laptop,  dado  que  los  precios  eran  equivalentes.  Los 
resultados  se  muestran  en  la  tabla. 

Marca  I  Marca  II  Marca  III 

115  120  65 

Use  el  primer  applet  Goodness-of-Fit  para  determinar 
si  los  consumidores  tienen  preferencia  por  una  de  tres 
marcas.  Si  existe  una  diferencia  significativa,  describa  la 
diferencia  en  terminos  practicos.  Use  a  =  .01. 

14.66  En  el  ejercicio  14.13,  se  dio  la  distribucion 
de  colores  de  dulces  M&M’S  de  chocolate  con  leche. 

Use  el  tercer  applet  Goodness-of-Fit  para  verificar  los 
resultados  del  ejercicio  14.13.  (',Los  datos  comprueban  los 
porcentajes  publicados  por  Mars,  Incorporate?  Describa 
la  naturaleza  de  las  diferencias,  si  las  hay. 

14.67  Consulte  la  distribucion  de  colores  dada  en  el 
ejercicio  14.13.  Usando  una  bolsa  de  tamano  individual 


de  dulces  de  chocolate  con  leche  M&M’S,  cuente  el 
numero  de  dulces  de  cada  uno  de  los  seis  colores.  Use 
el  tercer  applet  Goodness-of-Fit  para  determinar  si  los 
porcentajes  publicados  por  Mars,  Incorporated  pueden 
comprobarse.  Describa  la  naturaleza  de  las  diferencias, 
si  las  hay. 

14.68  Repita  las  instrucciones  del  ejercicio  14.67 
con  otra  bolsa  individual  de  dulces  M&M’S. 

^Sus  conclusiones  son  iguales? 

14.69  Opinion  y  afiliacion  politics  Ungrupo 
de  306  personas  fue  entrevistado  para  determinar  sus 
opiniones  respecto  a  un  problema  particular  actual  de 
polltica  extranjera  de  Estados  Unidos.  A1  mismo  tiempo, 
se  registro  su  afiliacion  polltica.  ^Los  datos  de  la  tabla 
presentan  suficiente  evidencia  para  indicar  dependencia 
entre  afiliacion  polltica  y  la  opinion  expresada  para  la 
poblacion  muestreada?  Use  el  tercer  applet  Chi-Square 
Test  of  Independence. 

Aprueba  No  aprueba  No  opina 

Republicanos  114  53  17 

Democratas  87  27  8 

14.70  Un  estudio  de  las  decisiones  de  compra  de  tres 
gerentes  de  cartera  de  valores,  A,  B  y  C,  fue  realizado 
para  comparar  los  numeros  de  acciones  compradas  que 
resultaron  en  utilidades  en  un  periodo  menor  o  igual 

a  1  ano.  Cien  compras  seleccionadas  al  azar  fueron 
examinadas  por  cada  uno  de  los  gerentes.  (',L°S  datos 
dan  suficiente  evidencia  de  diferencias  entre  las  tasas  de 
compras  exitosas  para  los  tres  gerentes?  Use  el  tercer 
applet  Chi-Square  Test  of  Independence. 

ABC 

Utilidad  63  71  55 

No  utilidad  37  29  45 
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CASO 

prActico 

datos  Bibliotecas 


iUn  mo  to  do  de  marketing  puede  mejorar 
los  servicios  de  una  biblioteca? 


Carole  Day  y  Del  Lowenthal  estudiaron  las  respuestas  de  adultos  jovenes  en  su  evalua- 
cion  de  servicios  bibliotecarios.23  De  los  n  =  200  adultos  jovenes  que  intervinieron  en 
el  estudio,  n,  =  152  eran  estudiantes  y  n2  =  48  no  eran  estudiantes.  La  tabla  siguiente 
presenta  los  porcentajes  y  numeros  de  respuestas  favorables  para  cada  grupo  a  siete  pre- 
guntas  en  las  que  se  examinaron  la  atmosfera,  el  personal  y  el  diseno  de  la  biblioteca. 


Pregunta 

Estudiante, 

Favorable 

n,  =  152 

No  estudiante, 
Favorable 

n2  =  48 

P(x2] 

3 

Las  bibliotecas  son  amistosas 

79.6% 

121 

56.2% 

27 

<.01 

4 

Las  bibliotecas  son  aburridas 

77 

117 

58.3 

28 

<.05 

5 

Personal  de  biblioteca 
no  ayuda 

91.4 

139 

87.5 

42 

NS 

6 

Personal  de  biblioteca  ayudan 
menos  a  adolescentes 

60.5 

92 

45.8 

22 

<.01 

7 

Las  bibliotecas  son  tan 
silenciosas  que  son 
incomodas  uncomfortable 

75.6 

115 

52.05 

25 

<.01 

11 

Las  bibliotecas  deben  estar 
decoradas  con  colores 
mas  vivos 

29 

44 

18.8 

9 

NS 

13 

Las  bibliotecas  no 
tienen  mal  senalamiento 

45.4 

69 

43.8 

21 

NS 

Fuente:  Datos  de  C.  Day  y  D.  Lowenthal,  "The  Use  of  Open  Group  Discussions  in  Marketing  Library  Services  to  Young  Adults", 
por  C.  Day  y  D.  Lowenthal,  British  Journal  of  Educational  Psychology,  62(1992):  324-340. 


La  entrada  de  la  ultima  columna  marcada  P(x2)  es  el  valor  p  para  probar  la  hipotesis  de 
que  no  hay  diferencia  en  la  proportion  de  estudiantes  y  no  estudiantes  que  contestan 
cada  pregunta  favorablemente.  En  consecuencia,  cada  pregunta  da  lugar  a  una  tabla  de 
contingencia  de  2  X  2. 


1 .  Realice  una  prueba  de  homogeneidad  para  cada  pregunta  y  verifique  el  valor  p  infor- 
mado  de  la  prueba. 

2.  Las  preguntas  3,  4  y  7  son  relativas  a  la  atmosfera  de  la  biblioteca;  las  preguntas  5  y 
6  se  ocupan  del  personal  de  biblioteca;  y  las  preguntas  1 1  y  13  se  relacionan  al  diseno 
de  la  biblioteca.  ^Como  se  resumirfan  los  resultados  de  sus  analisis  con  el  diseno  de 
la  biblioteca?  (;C6mo  resumina  los  resultados  de  sus  analisis  respecto  a  estas  siete 
preguntas  relacionadas  con  la  imagen  de  la  biblioteca? 

3.  Con  la  information  dada,  (:  es  posible  hacer  alguna  prueba  posterior  respecto  a  la  pro¬ 
porcion  de  respuestas  favorables  contra  no  favorables  para  dos  o  mas  preguntas  simul- 
taneamente? 
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no  parametricas 


m 


Size  1 «  “Pp^pa7ed)) 
(makes  a'30l^r.ntainer  about  18 
Servings  pel ^  (cups>  per  bag 


OBJETIVO  GENERAL 


Sugars  Og^ 


8% 


En  los  capitulos  8-10  presentamos  tecnicas  estadisticas 
para  comparar  dos  poblaciones  contrastando  sus  respec¬ 
tive^  parametros  poblacionales  (por  lo  general  sus  medias 
poblacionales).  Las  tecnicas  de  los  capitulos  8  y  9  son 
aplicables  a  datos  que  son  al  menos  cuantitativos  y  las  del 
capitulo  10  son  aplicables  a  datos  que  tienen  distribuciones 
normales.  El  proposito  de  este  capitulo  es  presentar  varias 
pruebas  estadisticas  para  comparar  poblacionales  para  los 
numerosos  tipos  de  datos  que  no  satisfagan  las  suposi- 
ciones  especificadas  en  los  capitulos  8-10. 


INDICE  DEL  CAPITULO 


La  prueba  Fr  de  Friedman  (15.7) 

La  prueba  H  de  Kruskal-Wallis  (15.6) 

Pruebas  parametricas  contra  no  parametricas  (15.1) 

El  coeficiente  de  correlacion  de  rango  (15.8) 

La  prueba  del  signo  para  un  experimento  pareado  (15.3) 
La  prueba  de  la  suma  de  rango  de  Wilcoxon:  muestras 
aleatorias  independientes  (15.2) 

La  prueba  del  rango  con  signo  de  Wilcoxon  para  un 
experimento  pareado  (15.5) 


Protein  4g 

D  Anthony  Berenyi/Dreamstime 

)  {Como  esta  su  nivel 
de  colesterol? 

yCual  es  su  nivel  de  colesterol?  En  los  ultimos 
anos,  muchos  de  nosotros  nos  hemos  hecho  mas 
conscientes  de  nuestra  salud  cuando  leemos  las  eti- 
quetas  de  information  nutrimental  en  productos 
que  compramos  y  escogemos  que  sean  bajos  en 
grasas  y  colesterol  y  altos  en  fibras.  El  caso  prac- 
tico  del  final  de  este  capitulo  contiene  un  expe¬ 
rimento  de  prueba  del  sabor,  para  comparar  tres 
tipos  de  sustitutos  de  huevo,  usando  tecnicas  no 
parametricas. 
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Cuando  los  tamanos 
muestrales  sean  pequenos  y 
las  poblaciones  originales  no 
sean  normales,  use  tecnicas 
no  parametricas. 


INTRODUCCIQN 

Algunos  experimentos  generan  respuestas  que  pueden  ser  ordenadas  o  clasificadas,  pero 
el  valor  real  de  la  respuesta  no  puede  ser  medido  numericamente  excepto  con  una  escala 
arbitraria  que  se  puede  crear.  Puede  ser  que  el  experimentador  diga  solo  si  una  obser¬ 
vation  es  mayor  que  otra.  Quiza  pueda  clasificar  todo  un  conjunto  de  observaciones 
sin  saber  en  realidad  los  valores  numericos  exactos  de  las  mediciones.  A  continuation 
veamos  unos  cuantos  ejemplos: 

•  La  experiencia  de  ventas  de  cuatro  vendedores  son  clasificadas  de  la  mejor  a  la 
peor. 

•  Las  caracterfsticas  de  comestible  y  sabor  de  cinco  marcas  de  fibra  de  pasitas  son 
clasificadas  en  una  escala  arbitraria  de  1  a  5. 

•  Cinco  disenos  de  automovil  son  clasificados  del  mas  atractivo  al  menos  atractivo. 

(Como  pueden  analizarse  estos  datos?  Los  metodos  estadfsticos  de  muestra  pequena  pre- 
sentados  en  los  capitulos  10-13  son  validos  solo  cuando  la(s)  poblacion(es)  muestreada(s) 
es(son)  normal(es)  o  aproximadamente  lo  es(son).  Los  datos  formados  por  rangos  de  es- 
calas  arbitrarias  de  1  a  5  no  satisfacen  la  suposicion  de  normalidad,  incluso  a  un  grado 
razonable.  En  algunas  aplicaciones,  las  tecnicas  son  validas  si  las  muestras  se  toman  al 
azar  de  entre  poblaciones  cuyas  varianzas  son  iguales. 

Cuando  los  datos  no  parecen  satisfacer  estas  y  suposiciones  similares,  puede  usarse 
un  metodo  alternativo,  metodos  estadfsticos  no  parametricos.  Los  metodos  no  para¬ 
metricos  por  lo  general  satisfacen  las  hipotesis  en  terminos  de  distribuciones  poblacio- 
nales  mas  que  parametros  por  ejemplo  medias  y  desviaciones  estandar.  Es  frecuente  que 
las  suposiciones  parametricas  sean  sustituidas  por  suposiciones  mas  generales  acerca 
de  las  distribuciones  poblacionales  y  las  clasificaciones  de  las  observaciones  se  usen  a 
veces  en  lugar  de  las  mediciones  reales. 

Investigaciones  realizadas  demuestran  que  las  pruebas  estadfsticas  no  parametricas 
son  tan  capaces  de  detectar  diferencias  entre  poblaciones  como  los  metodos  parametricos 
de  capitulos  anteriores,  cuando  se  satisfacen  la  normalidad  y  otras  suposiciones.  Pueden 
ser  y  con  frecuencia  son,  mas  potentes  para  detectar  diferencias  poblacionales  cuando 
estas  suposiciones  no  se  satisfacen.  Por  esta  razon,  algunos  estadfsticos  estan  a  favor  de 
usar  procedimientos  no  parametricos  en  preferencia  a  sus  similares  parametricos. 

Presentaremos  metodos  no  parametricos  apropiados  para  comparar  dos  o  mas  pobla¬ 
ciones  usando  ya  sea  muestras  independientes  o  pareadas.  Tambien  presentaremos  una 
medida  de  asociacion  que  es  util  para  determinar  si  una  variable  aumenta  cuando  la  otra 
aumenta  o  si  una  variable  disminuye  cuando  la  otra  aumenta. 


LA  PRUEBA  DE  SUMA  DE  RANGO 
DE  WILCOXON:  MUESTRAS 
ALEATORIAS  INDEPENDIENTES 

Al  comparar  las  medias  de  dos  poblaciones  basadas  en  muestras  independientes,  el  es- 
tadfstico  pivote  era  la  diferencia  en  las  medias  muestrales.  Si  el  experimentador  no 
esta  seguro  de  que  las  suposiciones  requeridas  para  una  prueba  t  de  dos  muestras  sea 
satisfecha,  una  alternativa  es  sustituir  los  valores  de  las  observaciones  por  sus  rangos  y 
proceder  como  si  estos  fueran  las  observaciones  reales.  Dos  pruebas  no  parametricas 
diferentes  usan  un  estadfstico  de  prueba  basado  en  estos  rangos  de  muestra: 

•  Prueba  de  suma  de  rango  de  Wilcoxon 

•  Prueba  U  de  Mann-Whitney 
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Son  equivalentes  en  que  usan  la  misma  information  muestral.  El  procedimiento  que  pre- 
sentaremos  es  la  prueba  de  suma  de  rango  de  Wilcoxon,  propuesto  por  Frank  Wilcoxon, 
que  esta  basado  en  la  suma  de  los  rangos  de  la  muestra  que  tiene  el  tamano  muestral  mas 
pequeno. 

Supongamos  que  tenemos  nt  observaciones  de  la  poblacion  1  y  n2  observaciones 
de  la  poblacion  2.  La  hipotesis  nula  a  probar  es  que  las  dos  distribuciones  poblaciona- 
les  son  identicas,  contra  la  hipotesis  alternativa  de  que  las  distribuciones  poblacionales 
son  diferentes.  Estas  son  las  posibilidades  para  las  dos  poblaciones: 

•  Si  H0  es  verdadera  y  las  observaciones  han  provenido  de  las  mismas  o  identicas 
poblaciones,  entonces  las  observaciones  de  ambas  muestras  deben  mezclarse 

al  azar  cuando  conjuntamente  sean  de  rango  de  pequeno  a  grande.  La  suma  de 
los  rangos  de  las  observaciones  de  la  muestra  1  debe  ser  similar  a  la  suma  de  los 
rangos  de  la  muestra  2. 

•  Si,  por  el  contrario,  las  observaciones  de  la  poblacion  1  tienden  a  ser  mas  peque¬ 
nas  que  las  de  la  poblacion  2,  entonces  estas  observaciones  tendrfan  los  rangos 
mas  pequenos  porque  la  mayor  parte  de  estas  serfan  mas  pequenas  que  las  de  la 
poblacion  2.  La  suma  de  los  rangos  de  ellas  serfa  “pequena”. 

•  Si  las  observaciones  de  la  poblacion  1  tienden  a  ser  mas  grandes  que  las  de  la 
poblacion  2,  se  les  asignarfan  rangos  mas  grandes.  La  suma  de  sus  rangos  de 
estas  ultimas  tenderfan  a  ser  “grandes”. 

Por  ejemplo,  supongamos  que  tenemos  nx  =  3  observaciones  de  la  poblacion  1,  es 
decir,  2,  4  y  6,  y  n2  =  4  observaciones  de  la  poblacion  2,  o  sea  3,  5,  8  y  9.  La  tabla  15.1 
muestra  siete  observaciones  ordenadas  de  pequenas  a  grandes. 

Siete  observaciones  en  orden 

Observacion  x,  yx  x2  j/2  x3  y3  y, 

Datos  2  3  4  5  6  8  9 

Rango  123  4567 


A  la  observacion  mas  pequena,  xx  =  2,  se  le  asigna  el  rango  1 ;  a  la  siguiente  observacion 
mas  pequena,  y,  =  3,  se  le  asigna  el  rango  2;  y  asf  sucesivamente.  La  suma  de  los  rangos 
de  las  observaciones  de  la  muestra  lesl  +  3  +  5=  9yla  suma  de  rangos  de  la  mues- 
tra  2  es  2  +  4  +  6  +  7  =  19.  ^Como  se  determina  si  la  suma  de  rangos  de  las  observa¬ 
ciones  de  la  muestra  1  es  significativamente  pequena  o  significativamente  grande?  Esto 
depende  de  la  distribution  de  probabilidad  de  la  suma  de  rangos  de  una  de  las  muestras. 
Como  los  rangos  para  nx  +  n2  =  A  observaciones  son  los  primeros  N  entcros,  se  puede 
demostrar  que  la  suma  de  estos  rangos  es  N(N  +  1  )/2.  En  este  sencillo  ejemplo,  la  suma  de 
N  =  7  rangos  esl+2  +  3  +  4  +  5  +  6  +  7  =7(8)/2  o  sea  28.  En  consecuencia,  si  el 
experimentador  conoce  la  suma  de  rangos  para  una  de  las  muestras,  puede  hallar  la  otra 
por  sustraccion.  En  nuestro  ejemplo,  observe  que  la  suma  de  rangos  para  la  muestra  1 
es  9,  en  tanto  que  la  segunda  suma  de  rangos  es  (28  —  9)  =  19.  Esto  significa  que  solo  una 
de  las  dos  sumas  de  rangos  es  necesaria  para  la  prueba.  Para  simplificar  la  tabulation  de 
valores  crfticos  para  esta  prueba,  debe  usarse  la  suma  de  rangos  de  la  muestra  mas  pe¬ 
quena  como  estadfstico  de  prueba.  (',Que  ocurre  si  dos  o  mas  observaciones  son  iguales? 
A  observaciones  empatadas  se  les  asigna  el  promedio  de  los  rangos  que  tendrfan  las 
observaciones  si  hubieran  sido  ligeramente  diferentes  en  valor. 

Para  poner  en  practica  la  prueba  de  la  suma  de  rangos  de  Wilcoxon,  supongamos  que 
las  muestras  aleatorias  independientes  de  tamano  n,  y  n2  se  seleccionan  de  las  poblacio¬ 
nes  1  y  2,  respectivamente.  Representemos  con  nx  al  menor  de  los  tamanos  muestrales  y 
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con  7",  representemos  la  suma  de  los  rangos  de  las  observaciones  de  la  muestra  1.  Si  la 
poblacion  1  esta  a  la  izquierda  de  la  poblacion  2,  7)  sera  “pequena”.  T{  sera  “grande”  si 
la  poblacion  1  esta  a  la  derecha  de  la  2. 


FORMULAS  PARA  EL  ESTADISTICO 
DE  LA  SUMA  DE  RANGOS  DE  WILCOXON 
(PARA  MUESTRAS  INDEPENDIENTES) 

Sean 

Ti  =  Suma  de  rangos  para  la  primera  muestra 
T\  =  n^rii  +  n2  +  1)  —  7) 

T\  es  el  valor  de  la  suma  de  rangos  para  /;  si  las  observaciones  se  hubieran  orde- 
nado  de  grande  a  pequena.  {No  es  la  suma  de  rangos  para  la  segunda  muestra.) 
Dependiendo  de  la  naturaleza  de  la  hipotesis  alternativa,  uno  de  estos  dos  valores 
se  escogera  como  estadfstico  de  prueba,  T. 

La  tabla  7  del  apendice  I  se  puede  usar  con  el  fin  de  localizar  valores  criticos  para  el  esta- 
distico  de  prueba  para  cuatro  valores  diferentes  de  pruebas  de  una  cola  con  a  =  .05,  .025, 
.01  y  .005.  Para  usar  la  tabla  7  para  una  prueba  de  dos  colas,  los  valores  de  a  se  duplican, 
es  decir,  a  =  .10,  .05,  .02  y  .01.  La  entrada  de  la  tabla  da  el  valor  de  a  tal  que  P(T  <  a) 
<  a.  Con  la  intention  de  ver  como  localizar  un  valor  crftico  para  la  prueba  de  suma  de 
rango  de  Wilcoxon,  suponga  que  =  8  y  n2  =  10  para  una  prueba  de  una  cola  con  a  = 
.05.  Se  puede  usar  la  tabla  Id),  una  parte  de  la  cual  se  reproduce  en  la  tabla  15.2.  Observe 
que  la  tabla  esta  construida  suponiendo  que  n  <  n2.  Es  por  esta  razon  que  designamos  la 
poblacion  con  el  tamano  muestral  mas  pequeno  como  poblacion  1.  Los  valores  de  /;  ,  se 
muestran  en  sentido  horizontal  en  la  parte  superior  de  la  tabla  y  los  de  n2  se  muestran  en 
sentido  vertical  al  lado  izquierdo.  La  entrada  a  =  56,  sombreada,  es  el  valor  critico  para 
rechazar  H0.  La  hipotesis  nula  de  igualdad  de  las  dos  distribuciones  debe  ser  rechazada 
si  el  valor  observado  del  estadfstico  de  prueba  T  es  menor  o  igual  a  56. 


Parte  de  los  valores  criticos  de  cola  izquierda  al  5%, 
tabla  15.2  tabla  7  del  apendice  I 


n  i 


n2 

2 

3 

4 

5 

6 

7 

8 

3 

— 

6 

4 

— 

6 

11 

5 

3 

7 

12 

19 

6 

3 

8 

13 

20 

28 

7 

3 

8 

14 

21 

29 

39 

8 

4 

9 

15 

23 

31 

41 

51 

9 

4 

10 

16 

24 

33 

43 

54 

10 

4 

10 

17 

26 

35 

45 

56 

PRUEBA  DE  LA  SUMA  DE  RANGO  DE  WILCOXON 

Con  n,  denotemos  la  mas  pequena  de  las  dos  muestras.  Esta  muestra  proviene  de  la 
poblacion  1 .  Las  hipotesis  a  probar  son 

H0 :  Las  distribuciones  para  las  poblaciones  1  y  2  son  identicas 

versus  una  de  las  tres  hipotesis  alternativas: 
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Hd :  Las  distribuciones  para  las  poblaciones  1  y  2  son  diferentes  (una  prueba  de 
dos  colas) 

Hd :  La  distribucion  para  la  poblacion  1  esta  a  la  izquierda  de  la  de  la  poblacion  2 
(una  prueba  de  cola  izquierda) 

//a :  La  distribucion  para  la  poblacion  1  esta  a  la  derecha  de  la  de  la  poblacion  2 
(una  prueba  de  cola  derecha) 

1.  Ordene  todas  las  n]  +  n2  observaciones  de  pequena  a  grande. 

2.  Encuentre  Tu  la  suma  de  rangos  para  las  observaciones  de  la  muestra  1.  Este  es 
el  estadfstico  de  prueba  para  la  prueba  de  cola  izquierda. 

3.  Encuentre  T \  =  n\(nt  +  n2  +  1)  —  Tu  la  suma  de  los  rangos  de  las  observacio¬ 
nes  de  la  poblacion  1  si  los  rangos  asignados  se  hubieran  invertido  de  grandes  a 
pequenos.  (El  valor  de  T,  no  es  la  suma  de  los  rangos  de  las  observaciones  de 
la  muestra  2.)  Este  es  el  estadfstico  de  prueba  para  una  prueba  de  cola  derecha. 

4.  El  estadfstico  de  prueba  para  una  prueba  de  dos  colas  es  T,  la  minima  de  7)  y  T\. 

5.  H0  es  rechazada  si  el  estadfstico  de  prueba  observado  es  menor  o  igual  al  valor 
crftico  hallado  usando  la  tabla  7  del  apendice  I. 


Ilustramos  el  uso  de  la  tabla  7  con  el  siguiente  ejemplo. 

Las  frecuencias  de  aleteo  de  dos  especies  de  abejas  Euglossine  fueron  registradas  para 
una  muestra  de  n i  =  4  Euglossa  mandibularis  Friese  (especie  1)  y  n2  =  6  Euglossa 
imperialis  Cockerell  (especie  2).1  Las  frecuencias  se  detallan  en  la  tabla  15.3.  /Puede 
usted  concluir  que  las  distribuciones  de  aleteo  diberen  para  estas  dos  especies?  Prue- 
be  usando  a  =  .05. 


tabla  15.3  Frecuencias  de  aleteo  para  dos  especies  de  abejas 

Especie  1  Especie  2 

235  180 

225  169 

190  180 

188  185 

178 
182 


Solucion  Primero  es  necesario  ordenar  las  frecuencias  de  pequena  a  grande,  como 
se  observa  en  la  tabla  15.4. 


TABLA  15.4  Frecuencias  de  aleteo  ordenadas  de  pequena  a  grande 


Datos  Especie  Orden 


169  2  1 

178  2  2 

180  2  3 

180  2  4 

182  2  5 

185  2  6 

188  1  7 

190  1  8 

225  1  9 

235  1  10 


www.FreeLibros.me 


634  O  CAPITULO  15  ESTADfSTICAS  NO  PARAMETRICAS 


Las  hipotesis  a  probar  son 

H0 :  Las  distribuciones  de  las  frecuencias  de  aleteo  son  las  mismas  para  las  dos 
especies 

contra 

Ha :  Las  distribuciones  de  las  frecuencias  de  aleteo  difieren  para  las  dos  especies 

Como  el  tamano  muestral  para  individuos  de  la  especie  1,  /;  =  4,  es  el  mas  pequeno  de 
los  dos  tamanos  muestrales,  tenemos 

Tx  =  7  +  8  +  9  +  10  =  34 


y 

T\  =  nt («!  +  n2  +  1)  -  7\  =  4(4  +  6  +  1)  -  34  =  10 
Para  una  prueba  de  dos  colas,  el  estadistico  de  prueba  es  T  =  10.  la  menor  de  Tt  =  34 

y  t\  =  io. 

Para  esta  prueba  de  dos  colas  con  a  =  .05,  el  experimentador  puede  usar  la  tabla 
lb)  del  apendice  I  con  /?.,  =  4  y  n2  =  6.  El  valor  crftico  de  T  tal  que  P(T  <  a)  < 
all  =  .025  es  12,  y  se  debe  rechazar  la  hipotesis  nula  si  el  valor  observado  de  T  es  12 
o  menos.  Como  el  valor  observado  del  estadistico  de  prueba,  T  =  10,  es  menor  a  12,  se 
puede  rechazar  la  hipotesis  de  iguales  distribuciones  de  frecuencias  de  aleteo  al  nivel  de 
significancia  de  5%. 

Una  salida  impresa  MINITAB  de  la  prueba  de  suma  de  rango  de  Wilcoxon  (llamada 
Mann- Whitney  por  MINITAB)  para  estos  datos  se  da  en  la  figura  15.1.  Al  final  de  este 
capitulo  se  encuentran  instrucciones  para  generar  esta  salida  impresa  en  la  seccion  “Mi 
MINITAB”  al  final  de  este  capitulo.  Observe  que  la  suma  de  rango  de  la  primera  muestra 
se  da  como  W  =  34.0,  que  concuerda  con  nuestros  calculos.  Con  un  valor  p  reportado  de 
.0142  calculado  por  MINITAB,  se  puede  rechazar  la  hipotesis  nula  al  nivel  de  5%. 


FIGURA  1  5.1 

Salida  impresa  para  el 
ejemplo  15.1 


Prueba  Mann-Whitney  y  Cl:  especie  1,  especie  2 

N  Median 
Species  1  4  207.50 

Species  2  6  180.00 

Point  estimate  for  ETA1-ETA2  is  30.50 

95.7  Percent  Cl  for  ETA1-ETA2  is  (5.99,56.01) 

W  =  34.0 

Test  of  ETA1  =  ETA2  vs  ETA1  not  =  ETA2  is  significant  at  0.0142 
The  test  is  significant  at  0.0139  (adjusted  for  ties) 


Aproximacion  normal  a  la  prueba 
de  suma  de  rango  de  Wilcoxon 

La  tabla  7  del  apendice  I  contiene  valores  criticos  para  tamanos  muestrales  de  «,  < 
n2  =  3,  4,  ...,  15.  Siempre  que  nt  no  sea  demasiado  pequena,  las  aproximaciones  a  las 
probabilidades  para  el  estadistico  T  de  la  suma  de  rango  de  Wilcoxon  se  pueden  hallar 
usando  una  aproximacion  normal  a  la  distribucion  de  T.  Se  puede  demostrar  que  la 
media  y  varianza  de  T  son 


_  «i(«i  +  n2  +  1) 


t 


Algunos  investigadores  indican  que  la  aproximacion  normal  es  adecuada  para  muestras  de  hasta  solo  nx 


=  n2  =  4. 
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La  distribucion  de 

T  —  fxT 

z  — - 

(J j 

es  aproximadamente  normal  con  media  0  y  desviacion  estandar  1  para  valores  de  y 
n2  de  solo  10. 

Si  se  intenta  esta  aproximacion  para  el  ejemplo  15.1,  se  obtiene 
_  ni(jh  +  n2  +  1)  _  4(4  +  6  +  1) 


2  77i«2(«i  +  n2  +  1)  4(6)(4  +  6+1) 

(J~  /  •  —  — 


22 


El  valor  p  para  esta  prueba  es  2P(T  >  34).  Si  se  usa  una  correction  de  .5  para  continui- 
dad  al  calcular  el  valor  de  z  porque  nt  y  n2  son  pcquenas,  tenemos 


T  -  p,T  _  (34  -  .5)  —  22 

crT  V22 


2.45 


El  valor  p  para  esta  prueba  es 

2P(T  >  34)  =  2 P(z  2=  2.45)  =  2(.0071)  =  .0142 
el  valor  informado  de  la  salida  impresa  MINITAB  de  la  figura  15.1. 


PRUEBA  DE  LA  SUMA  DE  RANGO  DE  WILCOXON 
PARA  MUESTRAS  GRANDES:  n,  >  10  Y  n2  >  10 

1.  Hipotesis  nula:  H0 :  Las  distribuciones  de  poblacion  son  identicas 

2.  Hipotesis  alternativa:  Ha :  Las  dos  distribuciones  poblacionales  no  son  identicas 
(una  prueba  de  dos  colas);  o  Ha :  La  distribucion  de  la  poblacion  1  se  corre  a  la 
derecha  (o  a  la  izquierda)  de  la  distribucion  de  la  poblacion  2  (una  prueba  de  una 
cola). 

„  ^  ,  ,  T  ~  «i(«i  +  n2  +  l)/2 

3.  Estadistico  de  prueba:  z  =  , 

\  nxn2{nl  +  n2  +  1  )/l  2 

4.  Region  de  rechazo: 

a.  Para  una  prueba  de  dos  colas,  rechace  H0  si  z  >  Zan  o  z  <  ~Zan- 

b.  Para  una  prueba  de  una  cola  en  la  cola  derecha,  rechace  H0  si  z  >  za- 

c.  Para  una  prueba  de  una  cola  en  la  cola  izquierda,  rechace  H0  si  z  <  ~za- 
O  rechace  H0  si  el  valor  p  es  <  a. 

Los  valores  tabulados  de  z  se  encuentran  en  la  tabla  3  del  apendice  I. 

Se  realizo  un  experimento  para  comparar  las  resistencias  de  dos  tipos  de  papel  de  estraza: 
un  papel  de  estraza  estandar  de  un  peso  especificado  y  otro  es  el  mismo  papel  tratado  con 
una  sustancia  qufmica.  Diez  piezas  de  cada  tipo  de  papel,  seleccionadas  al  azar  de  entre 
la  produccion,  produjeron  las  mediciones  de  resistencia  que  se  muestran  en  la  tabla  15.5. 
Pruebe  la  hipotesis  nula  de  no  diferencia  en  las  distribuciones  de  resistencias  para  los 


Como  el  valor  de  T  =  34  esta  a  la  derecha  de  la  media  22,  la  resta  de  .5  al  usar  la  aproximacion  normal  toma  en 
cuenta  el  limite  inferior  de  la  barra  arriba  del  valor  34  en  la  distribucion  de  probabilidad  de  T. 
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dos  tipos  de  papel  contra  la  hipotesis  alternativa  de  que  el  papel  tratado  tiende  a  ser  mas 
fuerte  (es  decir,  su  distribucion  de  mediciones  de  resistencia  se  corre  a  la  derecha  de  la 
distribucion  correspondiente  para  el  papel  no  tratado). 

Mediciones  de  resistencia  (y  sus  rangos) 

TABLA  15.5  para  dos  tipos  de  papel 

Estandar  1  Tratado  2 


1.21  (2) 

1.49(15) 

1.43(12) 

1.37(7.5) 

1.35(6) 

1.67(20) 

1.51  (17) 

1.50(16) 

1.39(9) 

1.31  (5) 

1.17(1) 

1.29(3.5) 

1.48(14) 

1.52(18) 

1.42(11) 

1.37  (7.5) 

1.29  (3.5) 

1.44(13) 

1.40(10) 

1.53(19) 

Suma  de  rango  T,  =  85.5 

f,  =  /7,1/j,  +  ik  +  1)  -  T,  =  210  -  85.5  =  124.5 


Solucion  Como  los  tamanos  muestrales  son  iguales,  estamos  en  libertad  de  decidir 
cual  de  las  dos  muestras  debe  ser  la  muestra  1 .  Si  se  escoge  el  tratamiento  estandar  como 
la  primera  muestra,  se  pueden  clasificar  20  mediciones  de  resistencia  y  los  valores  de 
Ti  y  T\  se  ven  en  la  parte  inferior  de  la  tabla.  Como  se  desea  detectar  un  corrimiento  en 
las  mediciones  estandar  (1)  a  la  izquierda  de  las  mediciones  tratadas  (2),  se  realiza  una 
prueba  de  cola  izquierda: 

Hq  :  No  hay  diferencia  en  las  distribuciones  de  resistencia 

Ha :  La  distribucion  estandar  se  encuentra  a  la  izquierda  de  la  distribucion  tratada 

y  se  usa  T  =TX  como  el  estadfstico  de  prueba,  buscando  un  valor  inusualmente  pequeno 
de  T. 

Para  hallar  el  valor  critico  para  una  prueba  de  una  cola  con  a  =  .05,  indicemos  de  la 
tabla  Id)  del  apendice  I  con  nt  =  n2  =  10.  Usando  la  entrada  de  la  tabla,  se  puede  recha- 
zar  H0  cuando  T  <  82.  Como  el  valor  observado  del  estadistico  de  prueba  es  T  =  85.5, 
no  se  puede  rechazar  H(].  Hay  suficiente  evidencia  para  concluir  que  el  papel  de  estraza 
tratado  es  mas  fuerte  que  el  papel  estandar. 

Para  usar  la  aproximacion  normal  a  la  distribucion  de  T,  se  puede  calcular 

Wi(«i  +  n2  +  1)  10(21) 

dr  = - - - =  — - —  =  105 


y 

_ 2  _  "i«2(«i  +  n2  +  1)  _  10(10)(21)  _  1_!C 

cr  t  —  —  —  1  /  j 

12  12 

con  aT  =  V 175  =  13.23.  Entonces 

T-/jlt  85.5-105 

Z  — - — - —  —1.4/ 

<rr  13.23 

El  valor  p  de  una  cola  correspondiente  a  z  =  — 1.47  es 

valor  p  =  P(z<  ~  1.47)  =  .5  -  .4292  =  .0708 

que  es  mayor  que  a  =  .05.  La  conclusion  es  la  misma.  No  se  puede  concluir  que  el  papel 
de  estraza  tratado  sea  mas  fuerte  que  el  papel  estandar. 


www.FreeLibros.me 


15.2  LA  PRUEBA  DE  SUMA  DE  RANGO  DE  WILCOXON:  MUESTRAS  ALEATORIAS  INDEPENDIENTES  O  637 


^Cuando  se  puede  usar  la  prueba  de  la  suma  de  rango  de  Wilcoxon  en  preferencia  a 
la  prueba  t  no  pareada  de  dos  muestras?  La  prueba  t  de  dos  muestras  funciona  bien  si  los 
datos  estan  normalmente  distribuidos  con  varianzas  iguales.  Si  hay  duda  respecto  a  estas 
suposiciones,  puede  usarse  una  grafica  de  probabilidad  normal  para  evaluar  el  grado  de 
no  normalidad  y  se  puede  usar  una  prueba  F  de  dos  muestras  de  varianzas  muestrales 
para  verificar  la  igualdad  de  varianzas.  Si  estos  procedimientos  indican  ya  sea  no  nor¬ 
malidad  o  desigualdad  de  varianza,  entonces  es  apropiada  la  prueba  de  la  suma  de  rango 
de  Wilcoxon. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

15.1  Supongamos  que  se  desea  usar  la  prueba  de  la  suma 
de  rangos  de  Wilcoxon,  para  detectar  un  corrimiento  en  la 
distribucion  1  a  la  derecha  de  la  distribucion  2,  con  base 
en  muestras  de  tamano  n]  =  6  y  n2  =  8. 

a.  (?,Se  debe  usar  7j  o  T  ,  como  el  estadfstico  de  prueba? 

b.  ('Cual  es  la  region  de  rechazo  para  la  prueba  si  a  =  .05? 

c.  ,'Cual  es  la  region  de  rechazo  para  la  prueba  si  a  =  .01? 

1 5.2  Consulte  el  ejercicio  15.1.  Suponga  que  la 
hipotesis  alternativa  es  que  la  distribucion  1  se  corre  ya 
sea  a  la  izquierda  o  a  la  derecha  de  la  distribucion  2. 

a.  (?,Se  debe  usar  7j  o  T  ,  como  el  estadfstico  de  prueba? 

b.  ('Cual  es  la  region  de  rechazo  para  la  prueba 
si  a  =  .05? 

c.  ('Cual  es  la  region  de  rechazo  para  la  prueba 
si  a  =  .01? 

15.3  Observaciones  de  dos  muestras  aleatorias  e 
independientes,  tomadas  de  las  poblaciones  1  y  2,  se  dan 
aquf.  Use  la  prueba  de  la  suma  de  rango  de  Wilcoxon 
para  determinar  si  la  poblacion  1  esta  corrida  a  la 
izquierda  de  la  poblacion  2. 


Muestra  1 

1  3  2  3  5 

Muestra  2 

4  7  6  8  6 

a.  Exprese  la  hipotesis  nula  y  alternativa  a  probar. 

b.  Ordene  la  muestra  combinada  de  menor  a  mayor. 
Calcule  7’,  y  T\ . 

c.  ^Cual  es  la  region  de  rechazo  para  a  =  .05? 

d.  (',L°s  datos  dan  suficiente  evidencia  para  indicar  que 
la  poblacion  1  esta  corrida  a  la  izquierda  de  la 
poblacion  2? 

15.4  Muestras  aleatorias  independientes  de  tamano 
n,  =  20  y  n2  =  25  se  toman  de  las  poblaciones  1  y  2 
no  normales.  La  muestra  combinada  esta  ordenada  y 
Ti  =  252.  Use  la  aproximacion  de  muestra  grande  a  la 
prueba  de  la  suma  de  rango  de  Wilcoxon  para  determinar 
si  hay  una  diferencia  en  las  dos  distribuciones  de 
poblacion.  Calcule  el  valor  p  para  la  prueba. 


15.5  Supongamos  que  se  desea  detectar  un  corrimiento 
en  la  distribucion  1  a  la  derecha  de  la  distribucion  2, 
con  base  en  tamanos  muestrales  n,  =  12  y  n2=  14. 

Si  7i  =193,  ^que  se  concluye?  Use  a  =  .05. 

APLICACIONES 

15.6  Enfermedad  de  Alzheimer  En  algunas  pruebas 
de  salud  en  ancianos,  un  nuevo  medicamento  ha  restaurado 
su  memoria  casi  como  la  de  jovenes.  Pronto  se  probara 

en  pacientes  con  enfermedad  de  Alzheimer,  esa  fatal 
enfermedad  del  cerebro  que  destruye  la  mente.  Segun  el 
Dr.  Gary  Lynch,  de  la  Universidad  de  California  en  Irvine, 
el  medicamento,  llamado  ampakina  CX-516,  acelera 
senales  entre  celulas  cerebrales  que  parecen  agudizar 
significativamente  la  memoria.2  En  una  pmeba  preliminar 
en  estudiantes  de  poco  mas  de  20  anos  y  en  hombres 
de  entre  65  y  70  anos  de  edad,  los  resultados  fueron 
particularmente  sorprendentes.  Despues  de  recibir  dosis 
moderadas  de  este  medicamento,  las  personas  de  entre  65  y 
70  anos  de  edad  calificaron  casi  tan  alto  como  los  jovenes. 
Los  datos  siguientes  son  los  numeros  de  sflabas  sin  sentido 
recordadas  despues  de  5  minutos,  para  10  hombres  de 
poco  mas  de  20  anos  de  edad  y  10  senores  de  entre  65  y  70 
anos.  Use  la  prueba  de  la  suma  de  rango  de  Wilcoxon  para 
determinar  si  las  distribuciones  para  el  nurnero  de  sflabas 
sin  sentido  recordadas  son  iguales  para  estos  dos  grupos. 


20s 

3  6  4  8 

7 

1 

1 

2 

7 

8 

65-70s 

10  4  1 

2 

5 

0 

2 

2 

3 

15.7  Alzheimer,  continua  Consulte  el  ejercicio  15.6. 
Suponga  que  dos  grupos  mas  de  10  hombres  cada  uno 
son  probados  sobre  el  nurnero  de  sflabas  sin  sentido  que 
podfan  recordar  despues  de  5  minutos.  No  obstante,  a  los 
senores  de  entre  65  y  70  se  les  da  una  dosis  moderada  de 
ampakina  CX-516.  (',Los  datos  dan  suficiente  evidencia 
para  concluir  que  este  medicamento  mejora  la  memoria 
en  pacientes  de  entre  65  y  70  anos  en  comparacion  con 
los  de  poco  mas  de  20  anos?  Use  un  nivel  apropiado  de  a. 


20s 

11  7  6  8 

6 

9 

2 

10 

3 

6 

65-70s 

19  6  8 

7 

8 

5 

7 

10 

3 
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15.8  Contenido  de  oxigeno  disuelto  Las  observa- 
ciones  de  la  tabla  son  el  contenido  de  oxigeno  disuelto 
en  agua.  Cuanto  mas  alto  el  contenido  de  oxigeno 
disuelto,  mayor  es  la  capacidad  de  un  rio,  lago  o  arroyo 
para  sostener  fauna  acuatica.  En  este  experimento,  un 
inspector  de  control  de  contaminacion  sospechaba  que 
una  comunidad  riberena  estaba  descargando  aguas  negras 
tratadas  solo  en  parte  hacia  un  rio.  Para  comprobar  esta 
teoria,  cinco  especimenes  de  agua  de  rio,  tornados  al  azar, 
se  seleccionaron  en  un  lugar  aguas  arriba  del  pueblo  y, 
otras  cinco,  aguas  abajo.  Estas  son  las  lecturas  de  oxigeno 
disuelto  (en  partes  por  millon): 


Aguas  arriba 

4.8  5.2  5.0 

4.9  5.1 

Aguas  abajo 

5.0  4.7  4.9 

4.8  4.9 

a.  Use  una  prueba  de  suma  de  rango  de  Wilcoxon  de  una 
cola  con  a  =  .05  para  confirmar  o  refutar  la  teoria. 

b.  Use  una  prueba  t  de  Student  (con  a  =  .05)  para 
analizar  los  datos.  Compare  la  conclusion  alcanzada 
en  el  inciso  a). 

datos  15.9  Movimiento  de  ojos  Enuna 
investigacion  del  comportamiento  de 
exploracion  visual  de  ninos  sordos,  se  tomaron  medidas 
del  movimiento  de  ojos  en  nueve  ninos  sordos  y  nueve 
que  si  escuchaban.  La  tabla  siguiente  da  la  rapidez  de 
movimiento  de  ojos  y  sus  rangos  (en  parentesis). 

(Ue  parece  que  difieren  las  distribuciones  de  la  rapidez 
de  movimiento  de  ojos  de  ninos  sordos  y  de  ninos  que  si 
escuchan? 


Ninos  sordos  Ninos  que  si  escuchan 


2.75(15) 

.89(1) 

2.14(11) 

1 .43  (7) 

3.23(18) 

1.06  (4) 

2.07(10) 

1.01  (3) 

2.49(14) 

.94  (2) 

2.18(12) 

1.79(8) 

3.16(17) 

1.12(5.5) 

2.93(16) 

2.01  (9) 

2.20(13) 

1.12(5.5) 

Suma  de  rango  126 

45 

15.10  elevisores  a  color  La  tabla  siguiente  es  una 
lista  de  la  vida  util  (en  meses)  de  servicio  antes  de  fallar, 
en  una  tarjeta  de  circuitos  de  television  a  color,  para 
ocho  aparatos  de  la  firma  Ay  10  de  la  firma  B.  Use  la 
prueba  de  suma  de  rango  de  Wilcoxon  para  analizar  los 
datos  y  pruebe  para  ver  si  la  vida  de  servicio  antes  de 
falla  de  las  tarjetas  de  circuitos  difiere  para  las  tarjetas  de 
circuitos  producidas  por  los  dos  fabricantes. 


Firma 


A  32 

B  41 


Duracion  de  tarjeta  de  circuitos  (meses) 

25  40  31  35  29  37  39 

39  36  47  45  34  48  44  43 


33 


(^)datos  15.11  Pesos  de  tortugas  Los  pesos  de 

tortugas  capturadas  en  dos  lagos  diferentes  se 
midieron  para  comparer  los  efectos  de  los  ambientes  de 
los  dos  lagos  en  el  crecimiento  de  las  tortugas.  Todas  las 
tortugas  eran  de  la  misma  edad  y  fueron  marcadas  antes 
de  soltarlas  en  los  lagos.  A  continuacion  veamos  los 
pesos  para  =  10  tortugas  marcadas  y  capturadas  en  el 
lago  1  y  n2  =  8  capturadas  en  el  lago  2: 


Lago 

Pesos  (onzas) 

1 

14.1 

15.2 

13.9 

14.5  14.7  13.8 

14.0 

16.1  12.7  15.3 

2 

12.2 

13.0 

14.1 

13.6  12.4  11.9 

12.5 

13.8 

(',Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  las  distribuciones  de  peso  para  las  tortugas 
marcadas,  expuestas  a  los  ambientes  de  los  dos  lagos? 

Use  la  prueba  de  la  suma  de  rango  de  Wilcoxon  con 
a  =  .05  para  contestar  la  pregunta. 

((jj^ datos  15.12  Quimioterapia  El  tratamiento 
de  cancer  por  medios  quimicos,  llamado 
quimioterapia,  mata  celulas  cancerosas  y  celulas 
normales.  En  algunos  casos,  la  toxicidad  del  medicamento 
para  el  cancer,  es  decir,  su  efecto  sobre  celulas  normales, 
puede  reducirse  con  la  inyeccion  simultanea  de  un 
segundo  medicamento.  Se  realizo  un  estudio  para 
determinar  si  la  inyeccion  de  un  medicamento 
en  particular  reducfa  los  efectos  daninos  de  un  tratamiento 
de  quimioterapia  en  el  tiempo  de  sobre vivencia  de  ratas. 
Dos  grupos  de  12  ratas  seleccionados  al  azar  se  emplearon 
en  un  experimento  en  el  que  ambos  grupos,  llamemoslos 
A  y  B,  recibieron  la  droga  toxica  en  una  dosis  lo 
suficientemente  grande  para  causarles  la  muerte,  pero, 
ademas,  el  grupo  B  recibio  la  antitoxina  que  iba  a  reducir 
el  efecto  toxico  de  la  quimioterapia  en  celulas  normales. 
La  prueba  finalizo  al  termino  de  20  dfas,  o  sea,  480 
horas.  Los  tiempos  de  sobrevivencia  para  los  dos  grupos 
de  ratas,  a  las  4  horas  mas  cercanas,  se  muestran  en  la 


tabla  siguiente.  i 

Los  datos  dan  suficiente  evidencia  para 

indicar  que  las  ratas  que  recibieron  la  antitoxina  tienden 
a  sobrevivir  mas  despues  de  la  quimioterapia  que  las  que 
no  recibieron  la  antitoxina?  Use  la  prueba  de  la  suma  de 
rango  de  Wilcoxon  con  a  =  .05. 

Solo  quimioterapia 

Quimioterapia  mas  droga 

A 

B 

84 

140 

128 

184 

168 

368 

92 

96 

184 

480 

92 

188 

76 

480 

104 

244 

72 

440 

180 

380 

144 

480 

120 

196 
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LA  PRUEBA  DEL  SIGNO  PARA 
UN  EXPERIMENTO  PAREADO 

La  prueba  del  signo  es  un  procedimiento  relativamente  sencillo  que  se  puede  usar  para 
comparer  dos  poblaciones  cuando  las  muestras  consisten  en  observaciones  pareadas. 
Este  tipo  de  diseno  experimental  se  denomina  diseno  de  diferencia  pareada  o  pares 
comparados,  que  en  la  section  10.5  se  usaron  para  comparer  el  promedio  de  desgaste 
para  dos  tipos  de  llantas.  En  general,  para  cada  par,  se  mide  si  la  primera  respuesta,  por 
ejemplo  A,  excede  a  la  segunda  respuesta,  por  ejemplo  a  B.  El  estadistico  de  prueba  es 
x,  el  numero  de  veces  que  A  excede  a  B  en  los  n  pares  de  observaciones. 

Cuando  las  dos  distribuciones  poblacionales  son  identicas,  la  probabilidad  de  que  A 
exceda  a  B  es  igual  ap  =  .5,  y  x,  el  numero  de  veces  que  A  excede  a  B,  tiene  una  distri¬ 
bution  binomial.  Solo  pares  sin  empates  se  incluyen  en  la  prueba.  En  consecuencia,  se 
puede  probar  la  hipotesis  de  distribuciones  poblacionales  identicas  al  probar  H0 :  p  =  .5 
contra  una  alternativa  ya  sea  de  una  o  dos  colas.  Los  valores  crfticos  para  la  region  de 
rechazo  o  valores  p  exactos  se  pueden  hallar  usando  las  tablas  binomiales  acumulativas 
del  apendice  I. 


LA  PRUEBA  DEL  SIGNO  PARA  COMPARAR 
DOS  POBLACIONES 

1 .  Hipotesis  nula:  H0 :  Las  dos  distribuciones  poblacionales  son  identicas  y 

P( A  excede  aB)=g  =  .5 

2.  Hipotesis  alternativa: 

a.  Hd :  Las  distribuciones  poblacionales  no  son  identicas  y  p  =f=  .5 

b.  Hd :  La  poblacion  de  A  mediciones  se  corre  a  la  derecha  de  la  poblacion  de  B 
mediciones  y  p  >  .5 

c.  Hd :  La  poblacion  de  A  mediciones  se  corre  a  la  izquierda  de  la  poblacion  de  B 
mediciones  y  p  <  .5 

3.  Estadistico  de  prueba:  Para  n,  el  numero  de  pares  sin  empates,  use  x,  el  numero 

de  veces  que  (A  —  B)  es  positivo. 

4.  Region  de  rechazo: 

a.  Para  la  prueba  de  dos  colas  //a :  p  A  .5,  rechazar  H0  si  x  <  xL  o  x  >  xv,  donde 
P{ x  <  x,  )  <  al 2  y  P(x  >  x,i)  <  a/2  para  x  que  tenga  una  distribucion  binomial 
con  p  =  .5. 

b.  Para  //a :  p  >  .5,  rechazar  Ht]  si  x  >  xv  con  P(x  >  .%)  <  a. 

c.  Para  //a :  p  <  .5,  rechazar  H{)  si  x  <  xL  con  P(x  —  x,)  <  a. 

O  calcule  el  valor  p  y  rechace  H0  si  el  valor  p  <  a. 

Un  problema  que  puede  ocurrir  cuando  se  esta  realizando  una  prueba  del  signo  es 
que  las  mediciones  asociadas  con  uno  o  mas  pares  pueden  ser  iguales  y,  por  tanto,  resul¬ 
tan  en  observaciones  empatadas.  Cuando  esto  ocurra,  elimine  los  pares  empatados  y 
reduzca  n,  el  numero  total  de  pares.  El  ejemplo  siguiente  le  ayudara  a  entender  como  se 
construye  y  utiliza  la  prueba  del  signo. 

ejemplo  15.3  Los  numeros  de  fusibles  electricos  defectuosos  producidos  por  dos  lineas  de  production, 

A  y  B,  se  registraron  a  diario  durante  un  periodo  de  10  dias,  con  los  resultados  mostrados 
en  la  tabla  15.6.  La  variable  de  respuesta,  el  numero  de  fusibles  defectuosos,  tiene  una 
distribucion  binomial  exacta  con  un  gran  numero  de  fusibles  producidos  por  dia.  Aun 
cuando  esta  variable  tendra  aproximadamente  una  distribucion  normal,  el  supervisor  de 
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TABLA  15.6 


planta  preferiria  una  prueba  estadistica  rapida  y  facil  para  determinar  si  una  linea  de  pro¬ 
duction  tiende  a  producir  mas  fusibles  defectuosos  que  la  otra.  Use  la  prueba  del  signo 
para  probar  la  hipotesis  apropiada. 


Fusibles  defectuosos  de  dos  lineas  de  produccion 

Dia  LineaA  Linea  B  Signo  de  diferencia 


1 

170 

201 

— 

2 

164 

179 

- 

3 

140 

159 

- 

4 

184 

195 

- 

5 

174 

177 

- 

6 

142 

170 

- 

7 

191 

183 

+ 

8 

169 

179 

- 

9 

161 

170 

- 

10 

200 

212 

- 

Solution  Para  este  experimento  de  diferencia  pareada,  x  es  el  numero  de  veces  que 
la  observation  de  la  linea  A  excede  la  de  la  linea  B  en  un  dia  determinado.  Si  no  hay 
diferencia  en  las  distribuciones  de  fusibles  defectuosos  para  las  dos  lineas,  entonces  p, 
la  proportion  de  dias  en  la  que  A  excede  a  B,  es  .5,  que  es  el  valor  hipotetico  en  una 
prueba  del  parametro  binomial  p.  Valores  muy  pequenos  o  muy  grandes  de  x,  el  numero 
de  veces  que  A  excede  de  B,  son  contrarios  a  la  hipotesis  nula. 

Como  n  =  10  y  el  valor  hipotetico  de  p  es  .5,  la  tabla  1  del  apendice  I  se  puede  usar 
para  hallar  el  valor  p  exacto  para  la  prueba  de 

H0:  p  =  .5  contra  Ha:  p  =f=  .5 

El  valor  observado  del  estadistico  de  prueba,  que  es  el  numero  de  signos  “mas”  en  la 
tabla,  es  x  =  1,  y  el  valor  p  se  calcula  como 

valor  p  =  2 P(x  <  1)  =  2(.01 1)  =  .022 

El  valor  p  mas  bien  pequeno  =  .022  permite  rechazar  H0  al  nivel  de  5%.  Hay  evidencia 
significativa  para  indicar  que  el  numero  de  fusibles  defectuosos  no  es  el  mismo  para  las 
dos  lineas  de  produccion;  de  hecho,  la  linea  B  produce  mas  fusibles  defectuosos  que  la 
A.  En  este  ejemplo,  la  prueba  del  signo  es  una  herramienta  aproximada,  facil  de  calcu- 
lar,  para  detectar  lineas  de  produccion  con  falla  y  funciona  perfectamente  bien  para 
detectar  una  diferencia  significativa  usando  solo  una  cantidad  minima  de  information. 


Aproximacion  normal  para  la  prueba  del  signo 

Cuando  el  numero  de  pares  n  es  grande,  los  valores  crfticos  para  el  rechazo  de  H0  y  los 
valores  p  aproximados  se  pueden  hallar  usando  una  aproximacion  normal  a  la  distri¬ 
bution  de  x,  que  se  estudio  en  la  section  6.4.  Debido  a  que  la  distribution  binomial  es 
perfectamente  simetrica  cuando  p  =  .5,  esta  aproximacion  funciona  muy  bien,  incluso 
para  n  de  solo  10. 

Para  n  >  25,  se  puede  efectuar  la  prueba  del  signo  usando  el  estadistico  z, 

^  _x-  np  x-  ,5n 
\pnpq  .5  xfn 

como  el  estadistico  de  prueba.  Al  usar  z,  se  prueba  la  hipotesis  nula  p  =  .5  contra  la 
alternativa  p  A  .5  para  una  prueba  de  dos  colas  o  contra  la  alternativa  p  >  .5  to  p  <  .5) 
para  una  prueba  de  una  cola.  Las  pruebas  usan  las  conocidas  regiones  de  rechazo  del 
capitulo  9. 
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PRUEBA  DEL  SIGNO  PARA  MUESTRAS 
GRANDES:  n  >  25 

1 .  La  hipotesis  nula:  H0:  p  =  .5  (un  tratamiento  no  se  prefiere  a  un  segundo  trata- 
miento). 

2.  Hipotesis  alternativa:  Ha:  p  #  .5,  para  una  prueba  de  dos  colas  (nota:  Usamos  la 
prueba  de  dos  colas  como  ejemplo.  Muchos  analisis  podrfan  requerir  una  prueba 
de  una  cola.) 

3.  Estadistico  de  prueba:  z,  =  x-  -'^l 

.5  Vn 

4.  Region  de  rechazo:  Rechace  H0  si  z  —  zan  o  z  —  ~zan,  donde  z„n  es  el  valor  z  de 
la  tabla  3  del  apendice  I  correspondiente  a  un  area  de  a/2  en  la  cola  superior 

de  la  distribution  normal. 


Un  superintendente  de  production  dice  que  no  hay  diferencia  entre  los  porcentajes  de 
accidentes  de  empleados  en  turnos  de  dfa  o  de  noche  en  una  gran  planta  manufacturera. 
El  numero  diario  de  accidentes  se  registran  para  los  turnos  de  dia  y  de  noche  durante  n  = 
100  dfas.  Se  encuentra  que  el  numero  diario  de  accidentes  en  el  turno  de  noche  xE  exce- 
dio  al  numero  correspondiente  de  accidentes  en  el  turno  de  dia  xD  en  63  de  los  100  dfas. 

Estos  resultados  dan  suficiente  evidencia  para  indicar  que  mas  accidentes  tienden  a 
ocurrir  en  un  turno  que  en  el  otro,  o  bien,  lo  que  es  equivalente,  que  P(xv  >  xD)  #  1/2? 

Este  estudio  es  un  experimento  de  diferencia  pareada,  con  n  =100  pares 
de  observaciones  correspondientes  a  los  100  dfas.  Para  probar  la  hipotesis  nula  de  que  las 
dos  distribuciones  de  accidentes  son  identicas,  se  puede  usar  el  estadistico  de  prueba 

7  =  x  ~ 

^  .5Vii 

donde  x  es  la  cantidad  de  dfas  en  el  que  el  numero  de  accidentes  en  el  turno  de  noche 
excedio  al  de  accidentes  en  el  turno  de  dfa.  Entonces,  para  a  =  .05,  se  puede  rechazar  la 
hipotesis  nula  si  z  —  1.96  o  z  —  “1.96.  Sustituyendo  en  la  formula  para  z,  se  obtiene 

x  -  .5 n  63  -  (.5X100)  _  13  _  „  ^ 

z  =  ~3vT - ivS - T  =  260 

Como  el  valor  calculado  de  z  excede  de  z„n  =  1 .96,  se  puede  rechazar  la  hipotesis  nula. 
Los  datos  dan  suficiente  evidencia  para  indicar  una  diferencia  en  las  distribuciones  del 
porcentaje  de  accidentes  para  el  turno  de  dfa  contra  el  de  noche. 


^Cuando  debe  usarse  la  prueba  del  signo  en  preferencia  a  la  prueba  f?  Cuando  se 
da  solo  la  direction  de  la  diferencia  en  la  medicion,  solo  se  puede  usar  la  prueba  del 
signo.  Por  el  contrario,  cuando  los  datos  son  cuantitativos  y  satisfacen  las  suposiciones 
de  normalidad  y  varianza  constante,  debe  usarse  la  prueba  t  pareada.  Se  puede  usar  una 
grafica  de  probabilidad  normal  para  evaluar  normalidad,  en  tanto  que  una  grafica  de  los 
residuales  (d,  —  d)  puede  revelar  grandes  desviaciones  que  podrfan  indicar  una  varianza 
que  varfa  de  un  par  a  otro.  Cuando  haya  dudas  acerca  de  la  validez  de  las  suposiciones, 
los  estadfsticos  recomiendan  con  frecuencia  que  se  realicen  ambas  pruebas.  Si  las  dos 
llegan  a  las  mismas  conclusiones,  entonces  los  resultados  de  la  prueba  parametrica  pue- 
den  considerarse  validos. 
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EJERCICIOS 


TECNICAS  BASICAS 

15.13  Supongamos  que  se  desea  usar  la  prueba  del 
signo  para  probar  H„ :  p  >  .5  para  un  experimento 
de  diferencia  pareada  con  n  =  25  pares. 

a.  Exprese  la  situacion  practica  que  dicta  la  hipotesis 
alternativa  dada. 

b.  Use  la  tabla  1  del  apendice  I  para  hallar  valores  de  a 
(a  <  .15)  disponible  para  la  prueba. 

15.14  Repita  las  instrucciones  del  ejercicio  15.13  para 
H^  -.p  #  .5. 

15.15  Repita  las  instrucciones  de  los  ejercicios  15.13  y 
15.14  para  n  =  10,  15  y  20. 

datos  15.16  Se  realizo  un  experimento  de  diferencia 
pareada  para  comparar  dos  poblaciones.  Los 
datos  se  muestran  en  la  tabla  siguiente.  Use  la  prueba  del 
signo  para  determinar  si  las  distribuciones  poblacionales 
son  diferentes. 

Pares 

Poblacion  1  2  3  4  5  6  7 

1  8.9  8.1  9.3  7.7  10.4  8.3  7.4 

2  8.8  7.4  9.0  7.8  9.9  8.1  6.9 

a.  Exprese  la  hipotesis  nula  y  alternativa  para  la  prueba. 

b.  Determine  una  region  de  rechazo  apropiada  con 
a*  .01. 

c.  Calcule  el  valor  observado  del  estadfstico  de  prueba. 

d.  7,Los  datos  presentan  suficiente  evidencia  para  indicar 
que  las  poblaciones  1  y  2  son  diferentes? 

APLICACIONES 

datos  15.17  Valores  de  propiedades  Enel 

ejercicio  10.45  comparamos  las  evaluaciones 
de  propiedades  de  dos  asesores  de  impuestos,  A  y  B.  Sus 
evaluaciones  para  ocho  propiedades  se  muestran  en  la 
tabla: 

Propiedad  AsesorA  AsesorB 


1 

76.3 

75.1 

2 

88.4 

86.8 

3 

80.2 

77.3 

4 

94.7 

90.6 

5 

68.7 

69.1 

6 

82.8 

81.0 

7 

76.1 

75.3 

8 

79.0 

79.1 

a.  Use  la  prueba  del  signo  para  determinar  si  los  datos 
presentan  evidencia  suficiente  para  indicar  que  uno 
de  los  asesores  tiende  a  ser  consistentemente  mas 
conservador  que  el  otro;  es  decir,  P(xA  >  x„)  A  1/2. 


Pruebe  usando  un  valor  de  a  cercano  a  .05.  Encuentre 
el  valor  p  para  la  prueba  e  interprete  su  valor. 

El  ejercicio  10.45  usa  el  estadfstico  t  para  probar 
la  hipotesis  nula  de  que  no  hay  diferencia  en  las 
evaluaciones  medias  de  propiedades  entre  los  asesores 
A  y  B.  Compruebe  la  respuesta  (en  la  seccion  de 
respuestas)  para  el  ejercicio  10.45  y  comparela  con 
su  respuesta  al  inciso  a).  ^Concuerdan  los  resultados 
de  la  prueba?  Explique  por  que  las  respuestas  son 
(o  no  son)  consistentes. 

datos  15.18  Cocina  de  gourmet  Dos  gourmets, 

A  y  B,  calificaron  22  comidas  en  una  escala  del 
1  al  10.  Los  datos  se  muestran  en  la  tabla.  (  Los  datos  dan 
suficiente  evidencia  para  indicar  que  uno  de  los  gourmets 
tiende  a  dar  calificaciones  mas  altas  que  el  otro?  Pruebe 
usando  la  prueba  del  signo  con  un  valor  de  a  cercano  a  .05. 


Comida  A 

B 

Comida  A 

B 

1 

6 

8 

12 

8 

5 

2 

4 

5 

13 

4 

2 

3 

7 

4 

14 

3 

3 

4 

8 

7 

15 

6 

8 

5 

2 

3 

16 

9 

10 

6 

7 

4 

17 

9 

8 

7 

9 

9 

18 

4 

6 

8 

7 

8 

19 

4 

3 

9 

2 

5 

20 

5 

4 

10 

4 

3 

21 

3 

2 

11 

6 

9 

22 

5 

3 

a.  Use  las  tablas  binomiales  del  apendice  I  para  hallar  la 
region  de  rechazo  exacta  para  la  prueba. 

b.  Use  el  estadfstico  z  de  muestra  grande,  (nota:  Aun 
cuando  la  aproximacion  de  muestra  grande  se  sugiere 
para  n  >  25,  funciona  bastante  bien  para  valores  de  n 
hasta  de  solo  15.) 

c.  Compare  los  resultados  de  los  incisos  a)  y  b). 

15.19  Niveles  de  plomo  en  la  sangre  Un  estudio 
publicado  en  la  American  Journal  of  Public  Health 
(Science  News),  primera  publication  en  seguir  los 
niveles  de  plomo  en  la  sangre  de  aficionados  al  tiro  al 
bianco  con  pistola,  en  polfgonos  de  tiro  bajo  techo  y  que 
cumplen  con  la  ley,  documenta  un  riesgo  significativo 
de  envenenamiento  por  plomo.3  Se  tomaron  medicio- 
nes  de  exposition  al  plomo  a  17  miembros  del  grupo 
de  entrenamiento  de  aplicacion  de  la  ley  antes,  durante 
y  despues  de  un  periodo  de  3  meses  de  instruction  de 
disparo  en  un  polfgono  de  tiro  bajo  techo  y  propiedad  del 
estado.  Ningun  recluta  tenfa  niveles  elevados  de  plomo 
en  la  sangre  antes  del  entrenamiento,  pero  15  de  los  17 
terminaron  su  entrenamiento  con  niveles  de  plomo  en  la 
sangre  considerados  “elevados”  por  la  Agenda  Europea 
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para  la  seguridad  y  la  salud  en  el  trabajo  (OSHA).  Si  el 
uso  de  un  polfgono  de  tiro  no  causa  aumento  en  niveles 
de  plomo  en  la  sangre,  entonces  p,  la  probabilidad  de  que 
aumente  el  nivel  de  plomo  en  la  sangre  de  una  persona, 
es  menor  o  igual  a  .5.  Pero,  si  el  uso  del  polfgono  de  tiro 
bajo  techo  causa  un  aumento  en  los  niveles  de  plomo  en 
la  sangre  de  una  persona,  entonces  p  >  .5.  Use  la  prueba 
del  signo  para  determinar  si  el  uso  de  un  polfgono  de  tiro 
bajo  techo  tiene  el  efecto  de  aumentar  el  nivel  de  plomo 
en  la  sangre  de  una  persona  con  a  =  .05.  (sugerencia: 
La  aproximacion  normal  a  probabilidades  binomiales  es 
bastante  precisa  para  n  =  17.) 


datos  15.20  Porcentajes  de  recuperacion  De 

10  hospitales  se  recolectaron  datos  clfnicos 
respecto  a  la  efectividad  de  dos  medicamentos  para  tratar 
una  enfermedad  particular.  Se  desea  saber  si  los  datos 
presentan  evidencia  suficiente  con  el  fin  de  indicar  un 
porcentaje  mas  alto  de  recuperacion  para  uno  de  los  dos 
medicamentos. 

a.  Pruebe  usando  la  prueba  del  signo.  Escoja  su  region 
de  rechazo  de  modo  que  a  sea  cercana  a  .05. 

b.  ^Por  que  podrfa  ser  inapropiado  usar  la  prueba  t  de 
Student  al  analizar  los  datos? 


Medicamento  A 


lospital 

Numero 
en  grupo 

Numero 

recuperado 

Porcentaje 

recuperado 

1 

84 

63 

75.0 

2 

63 

44 

69.8 

3 

56 

48 

85.7 

4 

77 

57 

74.0 

5 

29 

20 

69.0 

6 

48 

40 

83.3 

7 

61 

42 

68.9 

8 

45 

35 

77.8 

9 

79 

57 

72.2 

10 

62 

48 

77.4 

Medicamento  B 


Hospital 

Numero 
en  grupo 

Numero 

recuperado 

Porcentaje 

recuperado 

1 

96 

82 

85.4 

2 

83 

69 

83.1 

3 

91 

73 

80.2 

4 

47 

35 

74.5 

5 

60 

42 

70.0 

6 

27 

22 

81.5 

7 

69 

52 

75.4 

8 

72 

57 

79.2 

9 

89 

76 

85.4 

10 

46 

37 

80.4 

UNA  COMPARACION  DE  PRUEBAS 
ESTADISTICAS 


El  experimento  del  ejemplo  15.3  esta  disenado  como  experimento  de  diferencia  pareada. 
Si  se  satisfacen  las  suposiciones  de  normalidad  y  varianza  constante,  a2d,  para  las  diferen- 
cias,  1 1  a  prueba  del  signo  detectarfa  un  cambio  en  la  ubicacion  para  las  dos  poblaciones 
tan  eficientemente  como  la  prueba  t  pareada?  Es  probable  que  no,  porque  la  prue¬ 
ba  t  usa  mucha  mas  informacion  que  la  prueba  del  signo.  Usa  no  solo  el  signo  de  la  dife¬ 
rencia,  sino  tambien  los  valores  reales  de  las  diferencias.  En  este  caso,  dirfamos  que  la 
prueba  del  signo  no  es  tan  eficiente  como  la  prueba  t  pareada.  No  obstante,  la  prueba  del 
signo  podrfa  ser  mas  eficiente  si  no  se  satisfacen  las  suposiciones  acostumbradas. 

Cuando  dos  pruebas  estadfsticas  diferentes  se  pueden  usar  ambas  para  probar  una 
hipotesis  basada  en  los  mismos  datos,  es  natural  preguntar  cual  es  mejor?  Una  forma  de 
contestar  esta  pregunta  serfa  mantener  constante  el  tamano  muestral  n  y  a  tambien  cons¬ 
tante  para  ambos  procedimientos  y  comparar  (3,  la  probabilidad  de  un  error  tipo  II.  Los 
expertos  en  estadfstica,  sin  embargo,  prefieren  examinar  la  potencia  de  una  prueba. 


D  Potencia  =  1  —  [3  =  P(rechazar  H0  cuando  77,  es  verdadera) 

Como  (3  es  la  probabilidad  de  no  rechazar  la  hipotesis  nula  cuando  es  falsa,  la  potencia 
de  la  prueba  es  la  probabilidad  de  rechazar  la  hipotesis  nula  cuando  es  falsa  y  alguna 
alternativa  especificada  es  verdadera.  Es  la  probabilidad  de  que  la  prueba  haga  aquello 
para  lo  que  esta  disenada,  es  decir,  detectar  una  desviacion  de  la  hipotesis  nula  cuando 
exista  una  desviacion. 
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Probablemente  el  metodo  mas  comun  de  comparar  dos  procedimientos  de  prueba  es 
en  terminos  de  la  eficiencia  relativa  de  un  par  de  pruebas.  La  eficiencia  relativa  es  la 
razon  entre  los  tamanos  muestrales,  para  los  dos  procedimientos  de  prueba  requeridos 
para  alcanzar  la misma  ay  (3  para una  alternativa  determinada,  y  la hipotesis  nula. 

En  algunas  situaciones,  es  posible  que  el  experimentador  pueda  no  estar  demasiado 
preocupado  si  usa  la  prueba  mas  potente.  Por  ejemplo,  podrfa  escoger  usar  la  prueba  del 
signo  sobre  una  competidora  mas  potente  por  su  facilidad  de  aplicacion.  Entonces,  se 
podrfan  ver  pruebas  como  microscopios  que  se  usan  para  detectar  desviaciones  desde 
una  teorfa  hipotetica.  Uno  no  tiene  que  saber  la  potencia  exacta  de  un  microscopio  para 
usarlo  en  una  investigation  biologica,  y  lo  mismo  aplica  a  pruebas  estadisticas.  Si  el 
procedimiento  de  prueba  detecta  una  desviacion  desde  la  hipotesis  nula,  estamos  encan- 
tados;  si  no  es  asf,  se  puede  volver  a  analizar  los  datos  usando  un  microscopio  mas 
potente  (prueba),  o  se  puede  aumentar  la  potencia  del  microscopio  (prueba)  al  aumentar 
el  tamano  muestral. 


LA  PRUEBA  DE  RANGO  CON  SIGNO 
DE  WILCOXON  PARA 
UN  EXPERIMENTO  PAREADO 

Se  puede  usar  una  prueba  de  rango  con  signo,  propuesta  por  Frank  Wilcoxon,  para  anali¬ 
zar  el  experimento  de  diferencia  pareada  de  la  section  10.5  al  considerar  las  diferencias 
pareadas  de  dos  tratamientos,  1  y  2.  Bajo  la  hipotesis  nula  de  que  no  hay  diferencias  en 
las  distribuciones  para  1  y  2,  se  esperarfa  que  (en  promedio)  la  mitad  de  las  diferencias 
en  pares  sean  negativas  y  la  mitad  positivas;  esto  es,  el  numero  esperado  de  diferen¬ 
cias  negativas  entre  pares  serfa  n/2  (donde  n  es  el  numero  de  pares).  Ademas,  se  deduce 
que  las  diferencias  positivas  y  negativas  de  igual  magnitud  absoluto  deben  presentar- 
se  con  igual  probabilidad.  Si  fueramos  a  ordenar  las  diferencias  de  acuerdo  a  sus  valores 
absolutos  y  de  menor  a  mayor,  las  sumas  de  rango  esperadas  para  las  diferencias  negati¬ 
vas  y  positivas  serfa  igual.  Las  diferencias  grandes  en  las  sumas  de  los  rangos,  asignadas 
a  las  diferencias  positivas  y  negativas,  darfan  evidencia  para  indicar  un  cambio  en  lugar 
entre  las  distribuciones  de  respuestas  para  los  dos  tratamientos,  1  y  2. 

Si  la  distribucion  1  se  corre  a  la  derecha  de  la  distribucion  2,  entonces  se  espera  que 
mas  de  las  diferencias  sean  positivas  y  esto  resulta  en  un  numero  pequeno  de  diferencias 
negativas.  Por  tanto,  para  detectar  esta  alternativa  de  una  cola,  use  la  suma  de  rango  T  (la 
suma  de  los  rangos  de  las  diferencias  negativas)  y  rechace  la  hipotesis  nula  para  valores 
significativamente  pequenos  de  T~.  Junto  con  estas  mismas  lfneas,  si  la  distribucion  1  se 
corre  a  la  izquierda  de  la  distribucion  2,  entonces  se  espera  que  mas  de  las  diferencias 
sean  negativas  y  que  el  numero  de  diferencias  positivas  sea  pequeno.  En  consecuencia, 
para  detectar  esta  alternativa  de  una  cola,  use  T+  (la  suma  de  los  rangos  de  las  diferen¬ 
cias  positivas)  y  rechace  la  hipotesis  nula  si  T+  es  significativamente  pequena. 


cAlculo  del  estadistico  de  prueba  para 

LA  PRUEBA  DE  RANGO  CON  SIGNO  DE  WILCOXON 

1.  Calcule  las  diferencias  (jq  —  x2)  para  cada  uno  de  los  n  pares.  Las  diferencias 
iguales  a  0  se  eliminan  y  el  numero  de  pares,  n,  se  reduce  de  conformidad. 

2.  Ordene  los  valores  absolutos  de  las  diferencias  asignando  1  a  la  mas  pequena,  2 
a  la  segunda  mas  pequena,  y  asf  sucesivamente.  A  las  observaciones  empatadas 
se  les  asigna  el  promedio  de  los  rangos  que  se  hubieran  asignado  sin  empates. 

3.  Calcule  la  suma  de  rango  para  las  diferencias  negativas  y  marque  este  valor  T~. 
Del  mismo  modo,  calcule  T+,  la  suma  de  rango  para  las  diferencias  positivas. 
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Para  una  prueba  de  dos  colas,  use  la  menor  de  estas  dos  cantidades  T  como  un 
estadistico  de  prueba  para  probar  la  hipotesis  nula  de  que  los  dos  histogramas  de  fre- 
cuencia  relativa  poblacional  son  identicos.  Cuanto  menor  sea  el  valor  de  T,  mayor  es 
el  peso  de  evidencia  a  favor  de  rechazarla  hipotesis  nula.  Por  tanto,  se  rechazara  la 
hipotesis  nula  si  T  es  menor  o  igual  a  algun  valor,  por  ejemplo  Jo- 

Para  detectar  la  alternativa  de  una  cola,  esa  distribucion  1  se  corre  a  la  derecha 
de  la  distribucion  2,  use  la  suma  de  rango  T~  de  las  diferencias  negativas  y  rechace 
la  hipotesis  nula  para  valores  pequenos  de  T~,  por  ejemplo  T~  <  J0.  Si  desea  detectar 
un  corrimiento  a  la  distribucion  2  a  la  derecha  de  la  distribucion  1,  use  la  suma  de 
rango  T+  de  las  diferencias  positivas  como  estadistico  de  prueba  y  rechace  la  hipotesis 
nula  para  valores  pequenos  de  J+,  por  ejemplo,  T+  <  J0. 

La  probabilidad  de  que  T  sea  menor  o  igual  a  algun  valor  T0  se  ha  calculado  para 
una  combination  de  tamanos  muestrales  y  valores  de  T0.  Estas  probabilidades,  dadas  en 
la  tabla  8  del  apendice  I,  se  pueden  usar  para  hallar  la  region  de  rechazo  para  la 
prueba  T. 

Una  version  abreviada  de  la  tabla  8  se  muestra  en  la  tabla  15.7.  En  sentido  horizontal 
en  la  parte  superior  de  la  tabla  se  ve  el  numero  de  diferencias  (el  numero  de  pares)  n.  Los 
valores  de  a  para  una  prueba  de  una  cola  aparecen  en  la  primera  columna  de  la  tabla.  La 
segunda  columna  da  valores  de  a  para  una  prueba  de  dos  colas.  Las  entradas  de  la  ta¬ 
bla  son  los  valores  criticos  de  T.  Usted  recordara  que  el  valor  crftico  de  un  estadistico  de 
prueba  es  el  valor  que  localiza  la  frontera  de  la  region  de  rechazo. 

Por  ejemplo,  supongamos  que  tenemos  n  =  7  pares  y  se  realiza  una  prueba  de  dos 
colas  de  la  hipotesis  nula  de  que  las  dos  distribuciones  de  frecuencia  relativa  poblacional 
son  identicas.  A1  comprobar  la  columna  n  =  7  de  la  tabla  15.7  y  usar  el  segundo  renglon 
(correspondiente  a  a  =  .05  para  una  prueba  de  dos  colas),  se  ve  la  entrada  2  (som- 
breada).  Este  valor  es  J0,  el  valor  crftico  de  T.  Como  ya  se  vio  antes,  cuanto  menor  sea  el 
valor  de  J,  mayor  es  la  evidencia  para  rechazar  la  hipotesis  nula.  Por  tanto,  se  rechazara 
la  hipotesis  nula  para  todos  los  valores  de  T  menores  o  iguales  a  2.  La  region  de  rechazo 
para  la  prueba  de  rango  con  signo  de  Wilcoxon  para  un  experimento  pareada  es  siempre 
de  la  forma:  rechazar  H0  si  T  <  T0,  donde  J0  es  el  valor  crftico  de  T.  La  region  de  rechazo 
se  muestra  simbolicamente  en  la  figura  15.2. 

Version  abreviada  de  la  tabla  8  del  apendice  I; 
tabla  15.7  valores  criticos  de  T 


Una  cola 

Dos  colas 

n  =  I 

5  n  =  f 

5  n  =  l 

n  =  8 

n  =  9 

n=  10 
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a  = 
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1 

2 

4 

B 
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11 
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a  = 
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B 
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=  .01 

0 
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FIGURA  1  5.2 

Region  de  rechazo  para 
la  prueba  de  rango  con 
signo  de  Wilcoxon  para 
un  experimento  pareado 
(rechazar  H0  si  7"  <  T0) 


T 
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PRUEBA  DE  RANGO  CON  SIGNO  DE  WILCOXON 
PARA  UN  EXPERIMENTO  PAREADO 

1 .  Hipotesis  nula:  H0 :  Las  dos  distribuciones  de  frecuencia  relativa  poblacional  son 
identic  as 

2.  Hipotesis  alternativa:  Hd :  Las  dos  distribuciones  de  frecuencia  relativa  pobla¬ 
cional  difieren  en  ubicacion  (una  prueba  de  dos  colas);  o  Hd :  La  distribucion  de 
frecuencia  relativa  de  la  poblacion  1  se  corre  a  la  derecha  de  la  distribucion 

de  frecuencia  relativa  para  la  poblacion  2  (una  prueba  de  una  cola). 

3.  Estadistico  de  prueba 

a.  Para  una  prueba  de  dos  colas,  use  T,  la  menor  de  la  suma  de  rango  para 
diferencias  positivas  y  la  suma  de  rango  para  diferencias  negativas. 

b.  Para  una  prueba  de  una  cola  (detectar  la  hipotesis  alternativa  descrita  lmeas 
antes),  use  la  suma  de  rango  T~  de  las  diferencias  negativas. 

4.  Region  de  rechazo 

a.  Para  una  prueba  de  dos  colas,  rechace  H0  si  T  <  T0,  donde  T0  es  el  valor  crftico 
dado  en  la  tabla  8  del  apendice  I. 

b.  Para  una  prueba  de  una  cola  (detectar  la  hipotesis  alternativa  descrita  lineas 
antes),  use  la  suma  de  rango  T  de  las  diferencias  negativas.  Rechace  H0  si 

t  <  r0.+ 

_  ,  ,  „,+  n(n  +1) 

nota:  Se  puede  demostrar  que  T  +  T  = - . 


ejemplo  Se  realizo  un  experimento  para  comparar  las  densidades  de  pasteles  elaborados  de  dos 

clases  diferentes  de  mezclas  de  pastel,  A  y  B.  Seis  charolas  de  pastel  recibieron  la  masa 
A  y  seis  recibieron  la  masa  B.  Esperando  una  variation  en  la  temperatura  del  homo,  el 
experimentador  coloco  un  pastel  A  y  uno  B  juntos  en  seis  lugares  diferentes  del  homo. 
Prueba  la  hipotesis  de  que  no  hay  diferencia  en  las  distribuciones  poblacionales  de  den¬ 
sidades  de  pastel  para  dos  masas  para  pastel  diferentes. 

Solucion  Los  datos  (densidad  en  onzas  por  pulgada  cubica)  y  diferencias  en  densi- 
dad  para  seis  pares  de  pasteles  se  dan  en  la  tabla  15.8.  La  grafica  de  caja  de  las  diferen¬ 
cias  de  la  figure  15.3  muestra  un  sesgo  bastante  fuerte  y  una  diferencia  muy  grande  en 
la  cola  derecha,  lo  cual  indica  que  los  datos  pueden  no  satisfacer  la  suposicion  de  nor- 
malidad.  La  muestra  de  dos  diferencias  es  demasiado  pequena  para  tomar  decisiones 
validas  acerca  de  normalidad  y  varianza  constante.  En  esta  situation,  la  pmeba  de  rango 
con  signo  de  Wilcoxon  puede  ser  la  prueba  mas  prudente  a  usar. 

A1  igual  que  con  otras  pmebas  no  parametricas,  la  hipotesis  nula  a  probar  es  que  las 
dos  distribuciones  de  frecuencia  poblacionales  de  densidades  de  pastel  son  identicas. 
La  hipotesis  alternativa,  que  implica  una  prueba  de  dos  colas,  es  que  las  distribucio¬ 
nes  son  diferentes.  Como  la  cantidad  de  datos  es  pequena,  se  puede  efectuar  la  prueba 
usando  a  =  .  10.  De  la  tabla  8  del  apendice  I,  el  valor  crftico  de  T  para  una  prueba  de  dos 
colas,  a  =  .10,  es  T0  =  2.  Por  tanto,  se  puede  rechazar  H0  si  T  <  2. 


f  Para  detectar  un  cambio  de  distribucion  2  a  la  derecha  de  la  distribucion  1 ,  use  la  suma  de  rango  T+  de  las  diferen- 
cias  positivas  como  estadistico  de  prueba  y  rechace  H0  si  T+  <  T0. 
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TABLA  15  8  Densidades  de  seis  pares  de  pasteles 

Diferencia 

*a  *b  Ua  -  xB)  Rango 


.135 

.129 

.006 

2 

.102 

.120 

-.018 

5 

.098 

.112 

-.014 

4 

.141 

.152 

-.011 

3 

.131 

.135 

-.004 

1 

.144 

.163 

-.019 

6 

FIGURA  1  5.3 

Grafica  de  caja  de 
diferencias  para  el  ejemplo 
15.5 


-0.020  -0.015  -0.010  -0.005  0.000  0.005 

Diferencias 


Las  diferencias  (x,  —  x2)  estan  calculadas  y  ordenadas  de  acuerdo  a  sus  valores  abso- 
lutos  en  la  tabla  15.8.  La  suma  de  rangos  positivos  es  T+  =  2  y  la  suma  de  rangos  nega¬ 
tives  es  T  =  19.  El  estadistico  de  prueba  es  la  mas  pequena  de  estas  dos  sumas  de  rango, 
o  T  =  2.  Como  T  =  2  cae  en  la  region  de  rechazo,  se  puede  rechazar  H0  y  concluir  que 
las  dos  distribuciones  de  frecuencia  poblacional  de  densidades  de  pastel  difieren. 

Una  salida  impresa  MINITAB  de  la  prueba  de  rango  con  signo  de  Wilcoxon  se  da  en 
la  figura  15.4.  En  la  seccion  “Mi  MINITAB”,  al  final  de  este  capitulo,  se  encuentran  ins- 
trucciones  para  generar  esta  salida  impresa.  Se  puede  ver  que  el  valor  del  estadistico  de 
prueba  concuerda  con  los  otros  calculos  y  el  valor  p  indica  que  se  puede  rechazar  H0  al 
nivel  de  significancia  de  10%. 


FIGURA  1  5.4 

„  .. .  .  ,  •  Prueba  de  rango  con  signo  de  Wilcoxon:  diferencia 

Salida  impresa  MINITAB 

para  el  ejemplo  1 5.5  Test  of  median  =  0.000000  versus  median  not  =  0.000000 

N  for  Wilcoxon  Estimated 

N  Test  Statistic  P  Median 

Difference  6  6  2.0  0.093  -0.01100 


Aproximacion  normal  para  la  prueba 
de  rango  con  signo  de  Wilcoxon 

Aun  cuando  la  tabla  8  del  apendice  I  tiene  valores  criticos  para  n  de  hasta  50,  T' ,  al  igual 
que  la  prueba  de  rango  con  signo  de  Wilcoxon,  estara  distribuida  normalmente  en  forma 
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aproximada  cuando  la  hipotesis  nula  sea  verdadera  y  n  sea  grande,  por  ejemplo  25  o 
mas.  Esto  hace  posible  construir  una  prueba  z  de  muestra  grande,  donde 


E(T)  = 


n(n  +1) 

”” 4 

/ i(n  +  1)(2t7  +  1) 
24 


Entonces  el  estadfstico  z 

T+  -  n(n  +  1) 

__  T+  -  E(T+ ) _ 4 _ 

crr  +  jn(n  +  1 )  (2/7  +  1) 

\  24 

se  puede  usar  como  estadfstico  de  prueba.  Entonces,  para  una  prueba  de  dos  colas  y 
a  =  .05,  se  puede  rechazar  la  hipotesis  de  distribuciones  poblacionales  identicas  cuando 
Izl  >  1.96. 


PRUEBA  DE  MUESTRA  GRANDE  DE  RANGO 
CON  SIGNO  DE  WILCOXON  PARA  UN 
EXPERIMENTO  PAREADO:  n  >  25 


1 .  Hipotesis  nula:  H0 :  Las  distribuciones  1  y  2  de  frecuencia  relativa  poblacional 
son  identicas. 


2.  Hipotesis  alternativa:  Ha :  Las  dos  distribuciones  de  frecuencia  relativa  poblacio¬ 
nal  difieren  en  ubicacion  (una  prueba  de  dos  colas);  o  bien,  //a :  La  distribucion 
de  frecuencia  relativa  poblacional  1  esta  corrida  a  la  derecha  (o  izquierda)  de  la 
distribucion  de  frecuencia  relativa  para  la  poblacion  2  (una  prueba  de  una  cola). 


3.  Estadfstico  de  prueba:  z 


T+  -  [77(77  +  l)/4] 
\J[n(n  +  l)(2/7  +  l)/24] 


4.  Region  de  rechazo:  Rechazar  H0siz>  Zan  o  z  <  —Zen  para  una  prueba  de  dos 
colas.  Para  una  prueba  de  una  cola,  ponganse  todas  las  a  en  una  cola  de  la 
distribucion  z.  Para  detectar  un  cambio  en  la  distribucion  1  a  la  derecha  de 
la  distribucion  2,  rechazar  H0  cuando  z  >  Z„.  Para  detectar  un  cambio  en  la 
direccion  opuesta,  rechace  H0  si  z  <  —  za- 
Los  valores  tabulados  de  z  se  dan  en  la  tabla  3,  apendice  I. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

15.21  Suponga  que  se  desea  detectar  una  diferencia  en  las 
ubicaciones  de  dos  distribuciones  poblacionales,  basadas  en 
un  experimento  de  diferencia  pareada  de  n  =  30  pares. 

a.  De  la  hipotesis  nula  y  alternativa  para  la  prueba  de 
rango  con  signo  de  Wilcoxon. 

b.  De  el  estadfstico  de  prueba. 

c.  De  la  region  de  rechazo  para  la  prueba  para  a  =  .05. 

d.  Si  T+  =  249,  (',cuales  son  sus  conclusiones?  [nota: 

T+  +  T~  =  n(n  +  l)/2.] 


15.22  Consulte  el  ejercicio  15.21.  Supongamos  que 
se  desea  detectar  solo  un  cambio  en  la  distribucion  1 
a  la  derecha  de  la  distribucion  2. 

a.  De  la  hipotesis  nula  y  alternativa  para  la  prueba  de 
rango  con  signo  de  Wilcoxon. 

b.  De  el  estadfstico  de  prueba. 

c.  De  la  region  de  rechazo  para  la  prueba  para  a  =  .05 

d.  Si  T+  =  249,  ^cuales  son  sus  conclusiones?  [nota: 
T+  +T~  =  77(77  +  1  )/2.] 
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15.23  Consulte  el  ejercicio  15.21.  Realice  la  prueba 
usando  la  prueba  z  de  muestra  grande.  Compare  sus 
resultados  con  los  resultados  de  prueba  no  parametrica 
del  ejercicio  15.22,  inciso  d). 

15.24  Consulte  el  ejercicio  15.22.  Realice  la  prueba 
usando  la  prueba  z  de  muestra  grande.  Compare  sus 
resultados  con  los  resultados  de  la  prueba  no  parametrica 
del  ejercicio  15.21,  inciso  d). 

15.25  Consulte  el  ejercicio  15.16  y  el  conjunto  de  datos 
EX1516.  Los  datos  de  esta  tabla  son  de  un  experimento 
de  diferencia  pareada  con  n  =  7  pares  de  observaciones. 

Pares 

Poblacion  1  2  3  4  5  6  7 

1  8.9  8.1  9.3  7.7  10.4  8.3  7.4 

2  8.8  7.4  9.0  7.8  9.9  8.1  6.9 

a.  Use  la  prueba  de  rango  con  signo  de  Wilcoxon  para 
determinar  si  hay  diferencia  suficiente  entre  las  dos 
poblaciones. 

b.  Compare  los  resultados  de  la  parte  a  con  el  resultado  que 
obtuvo  en  el  ejercicio  15.16.  <',Son  iguales?  Explique. 

APLICACIONES 

15.26  Valores  de  propiedades  II  En  el  ejercicio 
15.17  se  utilizo  la  prueba  del  signo  para  determinar  si 
los  datos  daban  evidencia  suficiente  con  el  fin  de  indicar 
una  diferencia,  en  las  distribuciones  de  evaluaciones  de 
propiedad,  para  los  asesores  A  y  B. 

a.  Use  la  prueba  del  rango  con  signo  de  Wilcoxon  para  un 
experimento  pareado,  con  el  fin  de  probar  la  hipotesis 
nula  de  que  no  hay  diferencia  en  las  distribuciones  de 
evaluaciones  de  propiedades  entre  los  asesores  A  y  B. 
Pruebe  usando  un  valor  de  a  cercano  a  .05. 

b.  Compare  las  conclusiones  de  la  prueba  del  inciso 
a  con  las  conclusiones  derivadas  de  la  prueba  t  del 
ejercicio  10.43,  y  la  prueba  del  signo  del  ejercicio 
15.17.  Explique  por  que  estas  conclusiones  de  prueba 
son  (o  no  son)  consistentes. 

(^}datos  15.27  Descomposturas  de  maquinas 

El  numero  de  descomposturas  mensuales  en 
maquinas  se  registro  durante  9  meses  en  dos  maquinas 
identicas,  A  y  B,  empleadas  para  hacer  cables: 


Mes 

A 

B 

1 

3 

7 

2 

14 

12 

3 

7 

9 

4 

10 

15 

5 

9 

12 

6 

6 

6 

7 

13 

12 

8 

6 

5 

9 

7 

13 

a.  7,  Los  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  los  porcentajes  de  descomposturas 
mensuales  para  las  dos  maquinas?  Pruebe  usando 
un  valor  de  a  cercano  a  .05. 

b.  (:,Se  puede  considerar  una  razon  por  la  que  los 
porcentajes  de  descomposturas  para  las  dos  maquinas 
pudieran  variar  de  1  mes  a  otro? 

15.28  Cocina  de  gourmet  II  Consulte  la  comparacion 
de  calificaciones  de  comidas  de  gourmet  del  ejercicio 
15.18  y  use  la  prueba  de  rango  con  signo  de  Wilcoxon, 
para  determinar  si  los  datos  dan  evidencia  suficiente  con 
el  fin  de  indicar  una  diferencia  en  las  calificaciones  de 
los  dos  gourmets.  Pruebe  usando  un  valor  de  a  cercano 
a  .05.  Compare  los  resultados  de  esta  prueba  con  los 
resultados  de  la  prueba  con  signo  del  ejercicio  15.18. 

(■.Las  conclusiones  de  la  prueba  son  consistentes? 

f^)  datos  15.29  Control  de  transito  Dos  metodos  para 

controlar  el  transito,  A  y  B,  se  usaron  en  cada  una 
den  =  12  cruceros  durante  una  semana  y  los  numeros  de 
accidentes  que  ocurrieron  durante  ese  tiempo  se  registraron. 
El  orden  de  uso  (cual  se  emplearfa  para  la  primera  semana) 
se  selecciono  de  una  manera  aleatoria.  Se  desea  saber  si  los 
datos  dan  suficiente  evidencia  para  indicar  una  diferencia 
en  las  distribuciones  de  porcentajes  de  accidentes  para  los 
metodos  A  y  B  de  control  de  transito. 


Crucero 

Metodo 

A  B 

Crucero 

Metodo 
A  B 

1 

5 

4 

7 

2 

3 

2 

6 

4 

8 

4 

1 

3 

8 

9 

9 

7 

9 

4 

3 

2 

10 

5 

2 

5 

6 

3 

11 

6 

5 

6 

1 

0 

12 

1 

1 

a.  Analice  usando  una  prueba  del  signo. 

b.  Analice  usando  la  prueba  de  rango  con  signo  de 
Wilcoxon  para  un  experimento  pareado. 

(^)oatos  15.30  Rompecabezas  Ocho  personas  fueron 
seleccionadas  para  realizar  una  tarea  sencilla 
de  armar  un  rompecabezas  bajo  condiciones  normales  y 
bajo  condiciones  de  estres.  Durante  el  tiempo  de  estres, 
se  aplico  una  pequena  descarga  electrica  a  las  personas  3 
minutos  despues  del  inicio  del  experimento  y  cada 
30  segundos  de  ahf  en  adelante,  hasta  que  terminaran 
la  tarea.  Se  tomaron  lecturas  de  la  presion  sangufnea 
bajo  ambas  condiciones.  Los  datos  de  la  tabla  son  las 
lecturas  mas  altas  durante  el  experimento.  (-,Los  datos 
presentan  suficiente  evidencia  para  indicar  lecturas 
de  presion  sangufnea  mas  altas  bajo  condiciones  de 
estres?  Analice  los  datos  usando  la  prueba  de  rango  con 
signo  de  Wilcoxon  para  un  experimento  pareado. 
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Persona 

Normal 

Con  estres 

1 

126 

130 

2 

117 

118 

3 

115 

125 

4 

118 

120 

5 

118 

121 

6 

128 

125 

7 

125 

130 

8 

120 

120 

datos  15.31  Imagenes  y  recordar  palabras  Un 

grupo  de  psicologfa  realizo  un  experimento  para 
determinar  si  recordar  la  puntuacion,  en  la  que  se  dieron 
instrucciones  para  formar  imagenes  de  25  palabras, 
difiere  de  recordar  la  puntuacion  inicial  para  la  que  no 
se  dieron  instrucciones  de  imagenes.  Veinte  estudiantes 
participaron  en  el  experimento,  con  los  resultados  que 
se  indican  en  la  tabla  siguiente. 


(,Cuales  tres  procedimientos  de  prueba  se  pueden 
usar  para  probar  si  hay  diferencias  en  la  distribucion 
de  recordar  la  puntuacion  con  y  sin  imagenes?  7,  Que 
suposiciones  se  requieren  para  el  procedimiento 
parametrico?  (:,Estos  datos  satisfacen  esas 
suposiciones? 

Use  tan  to  la  prueba  del  signo  y  la  prueba  de  rango  con 
signo  de  Wilcoxon  para  probar  si  hay  diferencias  en 
las  distribuciones  de  recordar  la  puntuacion  bajo  estas 
dos  condiciones. 

Compare  los  resultados  de  las  pruebas  del  inciso  b). 
(ySon  iguales  las  conclusiones?  Si  no  es  asf,  ^por 
que  no? 


Estudiante 

Con 

imagenes 

Sin 

imagenes 

Estudiante 

Con  Sin 

imagenes  imagenes 

1 

20 

5 

11 

17 

8 

2 

24 

9 

12 

20 

16 

3 

20 

5 

13 

20 

10 

4 

18 

9 

14 

16 

12 

5 

22 

6 

15 

24 

7 

6 

19 

11 

16 

22 

9 

7 

20 

8 

17 

25 

21 

8 

19 

11 

18 

21 

14 

9 

17 

7 

19 

19 

12 

10 

21 

9 

20 

23 

13 

LA  PRUEBA  H  DE  KRUSKAL-WALLIS 
PARA  DISENOS  COMPLETAMENTE 
ALEATORIZADOS 

Asf  como  la  prueba  de  la  suma  de  rango  de  Wilcoxon  es  la  alternativa  no  parametrica  a 
la  prueba  t  de  Student  para  una  comparacion  de  medias  poblacionales,  la  prueba  H  de 
Kruskal- Wallis  es  la  alternativa  no  parametrica  al  analisis  de  la  prueba  F  de  varianza 
para  un  diseno  completamente  aleatorizado.  Se  usa  para  detectar  diferencias  en  ubi- 
caciones  entre  mas  de  dos  distribuciones  poblacionales  basadas  en  muestreo  aleatorio 
independiente. 

El  procedimiento  para  realizar  la  prueba  H  de  Kruskal -Wallis  es  semejante  al  em- 
pleado  para  la  prueba  de  suma  de  rango  de  Wilcoxon.  Supongamos  que  se  comparan 
k  poblaciones  basadas  en  muestras  aleatorias  independientes  /;  de  la  poblacion  1,  n2  de 
la  poblacion  2,  . . .,  nk  de  la  poblacion  k,  donde 


n\  +  n2  +  ■  •  •  +  nk  =  n 


El  primer  paso  es  ordenar  las  n  observaciones  de  la  mas  pequena  (rango  1)  a  la  mayor 
(rango  n).  A  las  observaciones  con  empate  se  les  asigna  un  rango  igual  al  promedio  de 
los  rangos  que  hubieran  recibido  de  haber  sido  casi  iguales  pero  no  empatadas.  A  con¬ 
tinuation  se  calculan  las  sumas  de  rangos  1\,  T2,  . . .,  Tk  para  las  k  muestras  y  se  calcula 
el  estadfstico  de  prueba 


H  = 


12 

n{n  +  1) 


A 


3 {n  +  1) 
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que  es  proporcional  a  £  «,(T,  —  T £,  la  suma  de  desviaciones  cuadradas  de  las  medias  de 
rango  alrededor  de  la  gran  media  T  =  n(n  +  l)/2 n  =  (n  +  l)/2.  Entre  mas  grandes  sean 
las  diferencias  en  ubicaciones  entre  las  k  distribuciones  poblacionales,  mayor  es  el  valor 
del  estadfstico  H.  Entonces,  se  puede  rechazar  la  hipotesis  nula  de  que  las  k  distribucio¬ 
nes  poblacionales  son  identicas  para  valores  grandes  de  H. 

7  Que  tan  grande  es  grande?  Se  puede  demostrar  (se  omite  la  demostracion)  que 
cuando  los  tamanos  muestrales  son  de  moderados  a  grandes,  por  ejemplo,  cada  tamano 
muestral  es  igual  a  cinco  o  mayor,  y  cuando  H0  es  verdadera,  el  estadfstico  H  tendra 
aproximadamente  una  distribucion  ji  cuadrada  con  {k  —  1)  grados  de  libertad.  Por  tanto, 
para  un  valor  determinado  de  a,  se  puede  rechazar  H0  cuando  el  estadfstico  H  exceda  de 
X"a  (vease  la  figura  15.5). 


FIGURA  1  5.5 

Distribucion  aproximada 
del  estadfstico  W cuando 
H0  es  verdadero 


m 


Distribucion  ji  cuadrada 


xi 


H 


Region  de  rechazo 


Los  datos  de  la  tabla  15.9  se  recolectaron  usando  un  diseno  completamente  aleatorizado. 
Son  las  calificaciones  del  examen  de  aprovechamiento  para  cuatro  diferentes  grupos 
de  estudiantes,  donde  cada  grupo  recibio  ensenanza  mediante  una  tecnica  diferente.  El 
objetivo  del  experimento  es  probar  la  hipotesis  de  que  no  hay  diferencia,  en  las  distri¬ 
buciones  poblacionales  de  las  calificaciones  del  examen  de  aprovechamiento,  contra  la 
alternativa  de  que  difieren  en  ubicacion;  esto  es,  al  menos  una  de  las  distribuciones  se 
pasa  arriba  de  las  otras.  Realice  la  prueba  usando  la  prueba  H  de  Kruskal- Wallis  con 
a  =  .05. 


Calificaciones  de  examen  (y  rangos) 
TABLA  15.9  para  cuatro  tecnicas  de  ensenanza 


1 

2 

3 

4 

65  (3) 

75(9) 

59(1) 

94 (23) 

87(19) 

69  (5.5) 

78(11) 

89(21) 

73(8) 

83(17.5) 

67  (4) 

80(14) 

79(12.5) 

81  (15.5) 

62(2) 

88  (20) 

81  (15.5) 

72(7) 

83(17.5) 

69(5.5) 

79(12.5) 

90 (22) 

76(10) 

Suma  de  rango  7,  =  63.5 

7  =  89 

7  =  45.5 

.TH 

II 

'-J 

CO 

Solucion  Antes  de  realizar  un  analisis  no  parametrico  de  estos  datos,  se  puede  usar 
un  analisis  de  varianza  de  una  via  para  dar  las  dos  graficas  de  la  figura  15.6.  Parece  que 
la  tecnica  4  tiene  una  varianza  mas  pequena  que  las  otras  tres  y  que  hay  una  marcada 
desviacion  en  la  cola  derecha  de  la  grafica  de  probabilidad  normal.  Estas  desviaciones 
podrfan  ser  consideradas  menores  y  podrfa  usarse  un  analisis  ya  sea  parametrico  o  no 
parametrico. 
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En  el  procedimiento  de  la  prueba  H  de  Kruskal-Wallis,  el  primer  paso  es  ordenar  las 
n  =  23  observaciones  de  menor  (rango  1)  a  mayor  (rango  23).  Estos  rangos  se  muestran 
en  parentesis  en  la  tabla  15.9.  Observe  como  se  manejan  los  empates.  Por  ejemplo,  dos 
observaciones  en  69  estan  empatadas  para  el  rango  5.  Por  tanto,  se  les  asigna  el  prome- 
dio  5.5  de  los  dos  rangos  (5  y  6)  que  hubieran  ocupado  si  hubieran  sido  ligeramente  dife- 
rentes.  Las  sumas  de  rango  Tu  T2,  T,  y  7)  para  las  cuatro  muestras  se  ven  en  el  renglon 
inferior  de  la  tabla.  Sustituyendo  sumas  de  rango  y  tamanos  muestrales  en  la  formula 
para  el  estadistico  H.  obtenemos 


H  = 


12 

n(n  +  1) 


2 


T2 

- - 3  (n  +  1) 

n-i 


12  (63.5)2  (89)2  (45.5)2  (78)2 

23(24)  L  6  7  6  4 


3(24) 


=  79.775102  -  72  =  7.775102 


La  region  de  rechazo  para  el  estadistico  H  para  a  =  .05  incluye  valores  de  H  >  ^205, 
donde  x2.os  esta  basada  en  (k  —  1)  =  (4  —  1)  =  3  grados  de  libertad.  El  valor  de  x'1  dado 
en  la  tabla  5  en  el  apendice  I  es  x^is  =  7.81473.  El  valor  observado  del  estadistico  H, 
H  =  7.775102,  no  cae  en  la  region  de  rechazo  para  la  prueba.  Por  tanto,  hay  evidencia 
insuficiente  para  indicar  diferencias  en  las  distribuciones  de  calificaciones  de  examen  de 
aprovechamiento  para  las  cuatro  tecnicas. 
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En  la  figura  15.7  se  da  una  salida  impresa  MINITAB de  la  prueba  H  de  Kruskal- Wallis. 
Observe  que  el  valor  p,  .051,  es  solo  ligeramente  mayor  que  el  nivel  de  5%  necesario 
para  declarar  significancia  estadfstica. 


FIGURA  1  5.7 

Salida  impresa  MINITAB 
para  la  prueba  Kruskal- 
Wallis  para  el  ejemplo 
15.6 


Prueba  Kruskal-Wallis:  calificaciones  contra  tecnicas 


Kruskal-Wallis  Test  on  Scores 


Techniques 

N 

Median 

Ave  Rank 

Z 

1 

6 

76.00 

10.6 

-0.60 

2 

7 

79.00 

12.7 

0.33 

3 

6 

71.50 

7.6 

-1.86 

4 

4 

88.50 

19.5 

2.43 

Overall 

23 

12.0 

H  =  7.78  DF  =  3  P  =  0.051 

H  =  7.79  DF  =3  P  =  0.051  (adjusted  for  ties) 


*  NOTE  *  One  or  more  small  samples 


EJEMPLO 


Compare  los  resultados  del  analisis  de  la  prueba  F  de  varianza,  para  probar  si  hay  dife- 
rencias  en  las  distribuciones  de  calificaciones  del  examen  de  aprovechamiento  para  las 
cuatro  tecnicas  del  ejemplo  15.6. 


Solucion  La  salida  impresa  MINITAB  para  un  analisis  de  varianza  de  una  via  para 
los  datos  de  la  tabla  15.9  se  dan  en  la  figura  15.8.  El  analisis  de  varianza  muestra  que  la 
prueba  F  para  probar  si  hay  diferencias  entre  las  medias  para  las  cuatro  tecnicas  es  signi¬ 
ficative  al  nivel  de  .028.  La  prueba  H  de  Kruskal-Wallis  no  detecto  un  cambio  en  distri¬ 
buciones  poblacionales  al  nivel  de  significancia  de  .05.  Aun  cuando  estas  conclusiones 
parecen  estar  muy  separadas,  los  resultados  de  la  prueba  no  difieren  en  mucho.  El  valor 
p  =  .028  correspondiente  a  F  =  3.77,  con  df\  =  3  y  df\  =  19,  es  ligeramente  menor  a 
.05,  en  contraste  con  el  valor  p  =  .05 1  para  H  =  7.78,  df  =  3,  que  es  ligeramente  mayor 
a  .05.  Alguien  que  vea  los  valores  p  para  las  dos  pruebas  verfa  poca  diferencia  en  los 
resultados  de  las  pruebas  F  y  H.  No  obstante,  si  nos  apegamos  a  la  eleccion  de  a  =  .05, 
no  se  puede  rechazar  H0  usando  la  prueba  H. 


FIGURA  1  5.8 

Salida  impresa  MINITAB 
para  el  ejemplo  15.7 


ANOVA  de  una  via:  calificaciones  contra  tecnicas 


Source 

DF 

SS 

MS 

F 

P 

Techniques 

3 

712.6 

237.5 

3.77 

0.028 

Error 

19 

1196.6 

63.0 

Total 

22 

1909.2 

LA  PRUEBA  H  DE  KRUSKAL-WALLIS  PARA 
COMPARAR  MAS  DE  DOS  POBLACIONES: 
DISENO  COMPLETAMENTE  ALEATORIZADO 
(MUESTRAS  ALEATORIAS  INDEPENDIENTES) 


1.  Hipotesis  nula:  H0 :  Las  k  distribuciones  poblacionales  son  identicas. 

2.  Hipotesis  alternativa:  Hd :  Al  menos  dos  de  las  k  distribuciones  poblacionales 
difieren  en  ubicacion. 

12  T2 

3.  Estadfstico  de  prueba:  H  = - X — -  —  3 (n  +  1) 

n{n  +1)  n, 

(continua) 
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LA  PRUEBA  H  DE  KRUSKAL-WALLIS  PARA 
COMPARAR  MAS  DE  DOS  POBLACIONES: 

DISENO  COMPLETAMENTE  ALEATORIZADO 
(MUESTRAS  ALEATORIAS  IN  DEPEN  DIENTES)  (conti  n  uacion) 

donde 

/?,  =  Tamano  muestral  para  la  poblacion  i 
T;  =  Suma  de  rango  para  la  poblacion  i 
n  =  Numero  total  de  observaciones  =  +  n2  +  •  •  •  +  nk 

4.  Region  de  rechazo  para  una  a  determinada:  H  >  x\  con  (k  —  1)  df 

Suposiciones 

•  Todos  los  tamanos  muestrales  son  mayores  o  iguales  a  5. 

•  Los  empates  toman  el  promedio  de  los  rangos  que  hubieran  ocupado  de  no  haber 
estado  empatados. 


La  prueba  H  de  Kruskal-Wallis  es  una  valiosa  alternativa  para  un  analisis  de  varianza 
de  una  via  cuando  son  violadas  las  suposiciones  de  normalidad  e  igualdad  de  varianza.  De 
nuevo,  graficas  normales  de  probabilidad  de  residuales  y  graficas  de  residuales  por 
grupo  de  tratamiento  son  utiles  para  determinar  si  estas  suposiciones  han  sido  violadas. 
Recuerde  que  una  grafica  de  probabilidad  normal  debe  aparecer  como  linea  recta  con 
pendiente  positiva;  las  graficas  de  residuales  por  grupos  de  tratamiento  deben  exhibit  la 
misma  dispersion  arriba  y  abajo  de  la  linea  0. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

datos  15.32  Se  compararon  tres  tratamientos  usando 
un  diseno  completamente  aleatorizado.  Los 
datos  se  muestran  en  la  tabla  siguiente. 

Tratamiento 
1  2  3 


26 

27 

25 

29 

31 

24 

23 

30 

27 

24 

28 

22 

28 

29 

24 

26 

32 

20 

30 

21 

33 

(',Los  datos  dan  suficiente  evidencia  para  indicar 
una  diferencia  en  lugar  para  al  menos  dos  de  las 
distribuciones  poblacionales?  Pruebe  usando  el 
estadistico  H  de  Kruskal-Wallis  con  a  =  .05. 


datos  15.33  Se  compararon  cuatro  tratamientos 

usando  un  diseno  completamente  aleatorizado. 
Los  datos  se  muestran  en  la  tabla  siguiente: 


Tratamiento 


1 

2 

3 

4 

124 

147 

141 

117 

167 

121 

144 

128 

135 

136 

139 

102 

160 

114 

162 

119 

159 

129 

155 

128 

144 

117 

150 

123 

133 

109 

(■,Los  datos  aportan  suficiente  evidencia  para  indicar 
una  diferencia  en  lugar  para  al  menos  dos  de  las 
distribuciones  poblacionales?  Pruebe  usando  el 
estadistico  H  de  Kruskal-Wallis  con  a  =  .05. 
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APLICACIONES 

15.34  Sitios  pantanosos  El  ejercicio  11.13 
presenta  datos  (vease  el  conjunto  de  datos  EX1 113)  sobre 
la  rapidez  de  crecimiento  de  vegetacion  en  cuatro  lugares 
pantanosos  y  no  urbanizados.  Se  seleccionaron  al  azar 
seis  plantas  en  cada  uno  de  los  cuatro  sitios  para  usarlas 
en  la  comparacion.  Los  datos  son  la  longitud  media 
de  hojas  por  planta  (en  centfmetros)  para  una  muestra 
aleatoria  de  10  hojas  por  planta. 


Lugar 

Longitud  media  de  hoja 

cm) 

1 

5.7 

6.3 

6.1 

6.0 

5.8 

6.2 

2 

6.2 

5.3 

5.7 

6.0 

5.2 

5.5 

3 

5.4 

5.0 

6.0 

5.6 

4.9 

5.2 

4 

3.7 

3.2 

3.9 

4.0 

3.5 

3.6 

a.  ^Los  datos  aportan  suficiente  evidencia  para 
indicar  una  diferencia  en  lugar  para  al  menos  dos 
de  las  distribuciones  de  longitud  media  de  hoja 
correspondientes  a  los  cuatro  lugares?  Pruebe  usando 
la  prueba  H  de  Kruskal-Wallis  con  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba. 

c.  Analizamos  este  mismo  conjunto  de  datos  en  el  ejercicio 
11.13  usando  un  analisis  de  varianza.  Encuentre  el  valor 
p  para  la  prueba  F  usado  para  comparar  las  cuatro  medias 
de  lugar  en  el  ejercicio  11.13. 

d.  Compare  los  valores  p  en  los  incisos  b)  y  c)  y  explique 
las  implicaciones  de  la  comparacion. 

15.35  Frecuencia  cardiaca  y  ejercicio  El  ejercicio 
1 1.60  presento  datos  (conjunto  de  datos  EX1 160) 
sobre  las  frecuencias  para  muestras  de  10  hombres 
seleccionados  al  azar  de  cada  uno  de  los  cuatro  grupos  de 
edades.  Cada  hombre  se  ejercito  en  una  caminadora  a  un 
ritmo  fijo  durante  12  minutos,  registrandose  el  aumento 
de  frecuencia  (la  diferencia  antes  y  despues  del  ejercicio, 
en  pulsaciones  por  minuto).  Los  datos  se  presentan  en  la 
tabla  siguiente: 


10-19 

20-39 

40-59 

60-69 

29 

24 

37 

28 

33 

27 

25 

29 

26 

33 

22 

34 

27 

31 

33 

36 

39 

21 

28 

21 

35 

28 

26 

20 

33 

24 

30 

25 

29 

34 

34 

24 

36 

21 

27 

33 

22 

32 

33 

32 

Total 

309 

275 

295 

282 

a.  7,  Los  datos  presentan  suficiente  evidencia  para  indicar 
diferencias  de  ubicacion  para  al  menos  dos  de  los 
cuatro  grupos  de  edad?  Pruebe  usando  la  prueba  H  de 
Kruskal-Wallis  con  a  =  .01. 


b.  Encuentre  el  valor  p  aproximado  para  la  prueba  del 
inciso  a). 

c.  Como  la  prueba  F  del  ejercicio  1 1.60  y  la  prueba  H 
del  inciso  a  son  pruebas  para  detectar  diferencias  en 
la  ubicacion  de  las  cuatro  poblaciones  de  frecuencia 
cardiaca,  ^corno  se  comparan  los  resultados  de  la 
prueba?  Compare  los  valores  p  para  las  dos  pruebas  y 
explique  las  implicaciones  de  la  comparacion. 

(^)datos  15.36  Aliveles  de  pH  en  el  agua  Un 

muestreo  de  acidez  de  agua  de  lluvia  para  10 
aguaceros  seleccionados  al  azar  se  registro  en  tres  lugares 
diferentes  en  Estados  Unidos:  el  noreste,  la  region  media 
del  Atlantico  y  el  sureste.  Las  lecturas  de  pH  para  estas 
10  lluvias  se  muestran  en  la  tabla.  (nota:  Las  lecturas  de 
pH  van  de  0  a  14;  0  es  acida,  14  es  alcalina.  El  agua  pura 
que  cae  en  aire  limpio  tiene  una  lectura  de  pH  de  5.7.) 

Noreste  Atlantico  medio  Sureste 


4.45 

4.60 

4.55 

4.02 

4.27 

4.31 

4.13 

4.31 

4.84 

3.51 

3.88 

4.67 

4.42 

4.49 

4.28 

3.89 

4.22 

4.95 

4.18 

4.54 

4.72 

3.95 

4.76 

4.63 

4.07 

4.36 

4.36 

4.29 

4.21 

4.47 

a-  i 

Los  datos  presentan  suficiente  ev 

diferencias  en  los  niveles  de  acidez  en  lluvias  en  los 


tres  diferentes  lugares?  Pruebe  usando  la  prueba  H  de 
Kruskal-Wallis. 


b.  Encuentre  el  valor  p  aproximado  para  la  prueba  del 
inciso  a  e  interpreted. 

(^)datos  15.37  Campanas  publicitarias  Los 

resultados  de  un  experimento  para  investigar 
el  reconocimiento  de  productos,  durante  tres  campanas 
publicitarias,  se  informaron  en  el  ejemplo  11.14.  Las 
respuestas  fueron  el  porcentaje  de  400  adultos  que 
estaban  familiarizados  con  el  producto  recien  anunciado. 
La  grafica  de  probabilidad  normal  indico  que  los  datos 
no  eran  aproximadamente  normales  y  debfa  usarse  otro 
metodo  de  analisis.  (jHay  una  diferencia  significativa 
entre  las  tres  distribuciones  poblacionales  de  donde 
vinieron  estas  muestras?  Use  un  metodo  no  parametrico 
apropiado  para  contestar  esta  pregunta. 


Campana 

1 

2 

3 

.33 

.28 

.21 

.29 

.41 

.30 

.21 

.34 

.26 

.32 

.39 

.33 

.25 

.27 

.31 
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LA  PRUEBA  Fr  DE  FRIEDMAN  PARA 
DISENOS  DE  BLOQUE  ALEATORIZADOS 


La  prueba  Fr  de  Friedman,  propuesta  por  Milton  Friedman,  economista  ganador  del 
Premio  Nobel,  es  una  prueba  no  parametrica  para  comparar  las  distribuciones  de  medi- 
ciones  para  k  tratamientos  disenados  en  n  bloques  usando  un  diseno  aleatorizado  de 
bloques.  El  procedimiento  para  realizar  la  prueba  es  muy  semejante  al  empleado  para  la 
prueba  H  de  Kruskal- Wallis.  El  primer  paso  en  el  procedimiento  es  ordenar  las  k  obser- 
vaciones  de  tratamiento  dentro  de  cada  bloque.  Los  empates  se  tratan  en  la  forma  usual; 
es  decir,  reciben  un  promedio  de  los  rangos  ocupados  por  las  observaciones  empatadas. 
Las  sumas  de  rango  Tu  T2,  Tk  se  obtienen  entonces  y  el  estadistico  de  prueba 


F,-  = 


12 


bk(k  +  1) 


£  Tj 


3  b(k  +  1) 


se  calcula.  El  valor  del  estadistico  Fr  esta  en  un  minimo  cuando  las  sumas  de  rango  son 
iguales,  esto  es,  7\  =  T2  =  •  •  •  =  Tk  y  aumenta  en  valor  cuando  aumentan  las  dife- 
rencias  entre  las  sumas  de  rango.  Cuando  el  numero  k  de  tratamientos  o  el  mi  mem  b 
de  bloques  sea  mayor  a  cinco,  la  distribucion  muestral  de  Fr  puede  ser  aproximada  por 
una  distribucion  ji  cuadrada  con  (k  —  1 )  df.  Por  tanto,  al  igual  que  para  la  prueba  FI  de 
Kruskal- Wallis,  la  region  de  rechazo  para  la  prueba  Fr  esta  formada  por  valores  de  F, 
para  los  cuales 

Fr  >  X\ 

Supongamos  que  se  desea  comparar  los  tiempos  de  reaction  de  personas  expuestas 
a  seis  estimulos  diferentes.  Una  medicion  del  tiempo  de  reaction  se  obtiene  al  someter  a 
una  persona  a  un  estimulo  y  luego  medir  el  tiempo  hasta  que  la  persona  presente  alguna 
reaction  especificada.  El  objetivo  del  experimento  es  determinar  si  existen  diferencias  en 
los  tiempos  de  reaction  para  los  estimulos  empleados  en  el  experimento.  Para  eliminar 
la  variation  de  una  persona  a  otra  en  el  tiempo  de  reaction,  cuatro  personas  participaron 
en  el  experimento  y  el  tiempo  de  reaction  de  cada  persona  se  registro  para  cada  uno  de 
los  seis  estimulos.  Los  datos  se  dan  en  la  tabla  15.10  (los  rangos  de  las  observaciones 
se  muestran  entre  parentesis).  Use  la  prueba  Fr  de  Friedman  para  determinar  si  los  datos 
presentan  suficiente  evidencia  para  indicar  diferencias  en  las  distribuciones  de  tiem¬ 
pos  de  reaction  para  los  seis  estimulos.  Pruebe  usando  a  =  .05. 


tabla  15.10  Tiempos  de  reaction  a  seis  estimulos 


Estimulos 


Persona 

A 

B 

C 

D 

E 

F 

1 

■6(2.5) 

.9(6) 

•8(5) 

■7(4) 

■5(1) 

•6(2.5) 

2 

■7  (3.5) 

1.1  (6) 

•7(3.5) 

■8(5) 

■5(1.5) 

■5(1.5) 

3 

■9(3) 

1.3  (6) 

1.0  (4.5) 

1.0  (4.5) 

■7(1) 

■8(2) 

4 

■5(2) 

■7(5) 

•8(6) 

.6(3.5) 

■4(1) 

.6(3.5) 

Suma  de  rango 

r,  =  ii 

f2  =  23 

7-3  =  19 

f4=  17 

Ts  =  4.5 

Te  =  9.5 

Solution  En  la  figura  15.9,  la  grafica  de  los  residuales  para  cada  uno  de  los  seis 
estimulos  deja  ver  que  los  estimulos  1,  4  y  5  tienen  varianzas  un  poco  menores  que  los 
otros  estimulos.  Ademas,  la  grafica  de  probabilidad  normal  de  los  residuales  revela  un 
cambio  en  la  pendiente  de  la  recta  que  sigue  a  los  primeros  tres  residuales,  asi  como  la 
curvatura  en  la  parte  superior  de  la  grafica.  Parece  que  un  analisis  no  parametrico  es 
apropiado  para  estos  datos. 
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FIGURA  1  5.9 


Una  grafica  de 

tratamientos  contra 

residuales  y  una  grafica  de 

0.10- 

probabilidad  normal 

de  residuales  para  el 

0.05- 

ejemplo  15.8 

■3  0.00- 

S 

1  -0.05- 

-0.10- 

-0.15- 

-0.20- 

Residuales  contra  estimulos 

(la  respuesta  es  tiempo) 


3  4 

Estimulo 


Grafica  de  probabilidad  normal  de  los  residuales 

(la  respuesta  es  tiempo) 


Se  desea  probar 

H0 :  Las  distribuciones  de  tiempos  de  reaccion  para  los  seis  estimulos  son  identicas 
contra  la  hipotesis  alternativa 

//a :  A1  menos  dos  de  las  distribuciones  de  tiempos  de  reaccion  para  los  seis  estimu- 
los  difieren  en  ubicacion 

La  tabla  15.10  muestra  los  rangos  (en  parentesis)  de  las  observaciones  dentro  de  cada 
bloque  y  las  sumas  de  rango  para  cada  uno  de  los  seis  estimulos  (los  tratamientos).  El 
valor  del  estadistico  F,  para  estos  datos  es 


FT  = 


12 

bk{k  +  1) 
12 

(4)(6)(7) 


XT;  -  3  b(k+  1) 

[(ll)2  +  (23)2  +  (19)2  +  •  •  •  +  (9.5)2] 


3(4)(7) 


=  100.75  -  84  =  16.75 


Como  el  numcro  k  =  6  de  tratamientos  excede  de  cinco,  la  distribucion  de  muestreo  de 
Fr  puede  ser  aproximada  por  una  distribucion  ji  cuadrada  con  (k  —  1)  =  (6  —  1)  =  5  df. 
Por  tanto,  para  a  =  .05,  se  puede  rechazar  H0  si 

F,  >  x  donde  ^205  =  1 1.0705 
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Esta  region  de  rechazo  se  muestra  en  la  figura  15.10.  Como  el  valor  observado  Fr  = 
16.75  excede  de  ^205  =  1 1.0705,  cae  en  la  region  de  rechazo.  Por  tanto,  se  puede  de- 
sechar  H0  y  concluir  que  las  distribuciones  de  tiempos  de  reaccion  difieren  en  ubi- 
cacion  para  al  menos  dos  estfmulos.  La  salida  impresa  MINITAB  de  la  prueba  F,  de 
Friedman  para  los  datos  se  da  en  la  figura  15.1 1. 


FIGURA  1  5.1  O 

Region  de  rechazo  para  el 
ejemplo  15.8 


/(C) 

a  =  .  05 

1 

^05=  11-0705 

I  Valor  observado 

Region  de  Fr 

de  rechazo 


FIGURA  15.11 

Salida  impresa  MINITAB 
para  el  ejemplo  15.8 


Prueba  de  Friedman:  tiempo  contra  estimulo  bioqueado  por  una  persona 

S  =  16.75  DF  =  5  P  =  0.005 

S  =  17.37  DF  =  5  P  =  0.004  (adjusted  for  ties) 


Stimulus  N 

1  4 

2  4 

3  4 

4  4 

5  4 

6  4 


Grand  median  = 


Est 

Sum  of 

Median 

Ranks 

0.6500 

11.0 

1.0000 

23 . 0 

0.8000 

19.0 

0.7500 

17.0 

0.5000 

4.5 

0.6000 

9.5 

0.7167 

Encuentre  el  valor  p  aproximado  para  la  prueba  del  ejemplo  15.8. 

Solucion  Si  se  consulta  la  tabla  5  del  apendice  I  con  5  df,  se  encuentra  que  el  valor 
observado  de  Fr  =  16.75  excede  del  valor  de  la  tabla  ^  ^  =  16.7496.  Por  tanto,  el  va¬ 
lor  p  es  muy  cercano  a  .005,  pero  ligeramente  menor  a  este. 


PRUEBA  Fr  DE  FRIEDMAN  PARA  UN  DISENO 
ALEATORIZADO  DE  BLOQUES 

1.  Hipotesis  nula:  H0 :  Las  k  distribuciones  poblacionales  son  identicas 

2.  Hipotesis  alternativa:  Hd :  Al  menos  dos  de  las  k  distribuciones  poblacionales 
difieren  en  ubicacion 

3.  Estadistico  de  prueba:  Fr  = - — - X  T]  ~  3b(k  +  1) 

H  bk(k  +1) 
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donde 

b  =  Numero  de  bloques 
k  =  Numero  de  tratamientos 

T,  =  Suma  de  rango  para  el  tratamiento  i,  i  =  1,2 ,  k 

4.  Region  de  rechazo:  Fr  >  Xa,  donde  xl  esta  basada  en  (k  —  1)  df 

Suposicion:  O  bien  el  numero  k  de  tratamientos  o  el  numero  b  de  bloques  es  mayor 
a  cinco. 


© 


EJERCICIOS 


TECNICAS  BASICAS 

datos  1 5.38  Se  usa  un  diseiio  aleatorizado  de  bloques  a. 
para  comparar  tres  tratamientos  en  seis  bloques. 


Tratamiento 


Bloque 

1 

2 

3 

1 

3.2 

3.1 

2.4 

2 

2.8 

3.0 

1.7 

3 

4.5 

5.0 

3.9 

4 

2.5 

2.7 

2.6 

5 

3.7 

4.1 

3.5 

6 

2.4 

2.4 

2.0 

a.  Use  la  prueba  Fr  de  Friedman  para  detectar  diferencias 
en  ubicacion  entre  las  tres  distribuciones  de 
tratamiento.  Pruebe  usando  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba  del 
inciso  a). 

c.  Efectue  un  analisis  de  varianza  y  de  la  tabla  ANOVA 
para  el  analisis. 

d.  De  el  valor  del  estadfstico  F  para  probar  la  igualdad  de 
las  tres  medias  de  tratamiento. 

e.  De  el  valor  p  aproximado  para  el  estadfstico  F  del 
inciso  d). 

f.  Compare  los  valores  p  para  las  pruebas  de  los  incisos 
a)  y  d),  y  explique  las  implicaciones  practicas  de  la 
comparacion. 

datos  15.39  Un  diseiio  aleatorizado  de  bloques 
se  usa  para  comparar  cuatro  tratamientos  en 

ocho  bloques. 


Tratamiento 


Bloque 

1 

2 

3 

4 

1 

89 

81 

84 

85 

2 

93 

86 

86 

88 

3 

91 

85 

87 

86 

4 

85 

79 

80 

82 

5 

90 

84 

85 

85 

6 

86 

78 

83 

84 

7 

87 

80 

83 

82 

8 

93 

86 

88 

90 

Use  la  prueba  Fr  de  Friedman  para  detectar  diferencias 
en  ubicacion  entre  las  cuatro  distribuciones  de 
tratamiento.  Pruebe  usando  a  =  .05. 

Encuentre  el  valor  p  aproximado  para  la  prueba  del 
inciso  a). 

Efectue  un  analisis  de  varianza  y  de  la  tabla  ANOVA 
para  el  analisis. 

Use  el  valor  del  estadfstico  F  para  probar  la  igualdad 
de  las  cuatro  medias  de  tratamiento. 

De  el  valor  p  aproximado  para  el  estadfstico  F  del 
inciso  d). 

Compare  los  valores  p  para  las  pruebas  de  los  incisos 
a)  y  d),  y  explique  las  implicaciones  practicas  de  la 
comparacion. 

APLICACIONES 

(^)datos  15.40  Precios  de  supermercado  Enuna 

comparacion  de  los  precios  de  artfculos  en  cinco 
supermercados,  se  seleccionaron  al  azar  seis  artfculos 
y  el  precio  de  cada  uno  se  registro  para  cada  uno  de 
los  cinco  supermercados.  El  objetivo  del  estudio  era 
ver  si  los  datos  indicaban  diferencias  en  los  niveles  de 
precios  entre  los  cinco  supermercados.  Los  precios  se 
detallan  en  la  tabla. 


Articulo 

Kash  n’ 
Karry 

Publix 

Winn- 

Dixie 

Albertsons 

Alimento 
por  menos 

Apio 

.33 

.34 

.69 

.59 

.58 

Pasta  dental 
Colgate 

1.28 

1.49 

1.44 

1.37 

1.28 

Caldo  de  res 
Campbell 

1.05 

1.19 

1.23 

1.19 

1.10 

Pina  picada 

.83 

.95 

.95 

.87 

.84 

Espagueti 

Mueller 

.68 

.79 

.83 

.69 

.69 

Salsa  de 

tomate 

Heinz 

1.41 

1.69 

1.79 

1.65 

1.49 
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a.  i La  distribution  de  los  precios  difiere  de  un 
supermercado  a  otro?  Pruebe  usando  la  prueba  Fr 
de  Friedman  con  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interpreted. 

datos  15.41  Productos  quimicos  toxicos  Se 

realizo  un  experimento  para  comparar  los 
efectos  de  tres  productos  quimicos  toxicos.  A,  B  y  C,  en 
la  piel  de  ratas.  Cuadros  de  una  pulgada  de  piel  fueron 
tratados  con  los  productos  y  luego  calificados  del  0  al 
10,  dependiendo  del  grado  de  irritation.  Tres  cuadros 
adyacentes  de  1  pulgada  fueron  marcados  en  los  lomos 
de  ocho  ratas  y  cada  uno  de  los  tres  productos  se  aplico 
a  cada  rata.  Asf,  el  experimento  fue  bloqueado  en  ratas 
para  eliminar  la  variation  en  sensibilidad  de  la  piel  de 
una  rata  a  otra. 


Ratas 


1 

2 

3 

4 

5 

6 

7 

8 

B 

A 

A 

C 

B 

C 

C 

B 

5 

9 

6 

6 

8 

5 

5 

7 

A 

C 

B 

B 

C 

A 

B 

A 

6 

4 

9 

8 

8 

5 

7 

6 

C 

B 

C 

A 

A 

B 

A 

C 

3 

9 

3 

5 

7 

7 

6 

7 

a.  (',L°s  datos  dan  suficiente  evidencia  para  indicar  una 
diferencia  en  los  efectos  toxicos  de  los  tres  productos 
quimicos?  Pruebe  usando  la  prueba  Fr  de  Friedman 
con  a  =  .05. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interpreted. 

datos  15.42  edicina  que  sabe  bien  En  un 

estudio  del  sabor  de  antibioticos  en  ninos,  la 
Dra.  Doreen  Matsui  y  colegas  emplearon  una  muestra 


voluntaria  de  ninos  sanos  para  evaluar  sus  reacciones 
al  sabor  de  cuatro  antibioticos.4  La  respuestas  de  los 
ninos  se  midieron  en  una  escala  analogica  visual  de  10 
centfmetros  (cm)  que  incorporaba  el  uso  de  rostros,  de 
tristes  (baja  calificacion)  a  alegres  (alta  calificacion). 
La  calificacion  minima  era  0  y  la  maxima  era  10.  Para 
los  datos  siguientes  (simulados  de  los  resultados  del 
informe  de  Matsui),  a  cada  uno  de  cinco  ninos  se  le 
pidio  probara  cada  uno  de  los  cuatro  antibioticos  y  los 
calificara  usando  la  escala  analogica  visual  (rostros)  de 
0  a  10  cm. 


Antibiotico 


Nino 

1 

2 

3 

4 

1 

4.8 

2.2 

6.8 

6.2 

2 

8.1 

9.2 

6.6 

9.6 

3 

5.0 

2.6 

3.6 

6.5 

4 

7.9 

9.4 

5.3 

8.5 

5 

3.9 

7.4 

2.1 

2.0 

a.  <^Que  diseno  se  usa  para  recolectar  estos  datos? 

b.  Usando  el  paquete  estadistico  apropiado  para  una 
clasificacion  de  dos  vias,  elabore  una  grafica  de 
probabilidad  normal  de  los  residuales  asi  como  una 
grafica  de  residuales  contra  antibioticos.  ^E1  analisis 
usual  de  suposiciones  de  varianza  parece  quedar 
satisfecho? 

c.  Use  la  prueba  no  parametrica  apropiada  para  probar  si 
hay  diferencias  en  las  distribuciones  de  respuestas  a 
los  sabores  de  los  cuatro  antibioticos. 

d.  Comente  sobre  los  resultados  del  analisis  de  varianza 
del  inciso  b)  comparados  con  la  prueba  no  parame¬ 
trica  del  inciso  c). 


COEFICIENTE  DE  CORRELACION 
DE  RANGO 

En  las  secciones  precedentes,  usamos  rangos  para  indicar  la  magnitud  relativa  de  observa- 
ciones  en  pruebas  no  parametricas  para  la  comparacion  de  tratamientos.  A  continuation 
usaremos  la  misma  tecnica  para  probar  una  relation  entre  dos  variables  ordenadas. 
Dos  coeficientes  comunes  de  correlation  de  rango  son  el  Spearman  r,  y  el  Kendall  t. 
Presentaremos  el  rs  de  Spearman  porque  su  calculo  es  identico  al  del  coeficiente  de 
correlation  muestral  r  de  los  capitulos  3  y  12. 

Supongamos  que  ocho  profesores  de  ciencias  de  escuela  elemental  han  sido  clasi- 
ficados  por  un  juez  de  acuerdo  con  su  capacidad  de  ensenanza  y  todos  han  tornado  un 
“examen  national  para  maestros”.  Los  datos  se  dan  en  la  tabla  15.1 1.  fLos  datos  sugie- 
ren  un  acuerdo  entre  la  calificacion  del  juez  y  la  calificacion  del  examen?  Esto  es,  i hay 
una  correlation  entre  rangos  y  calificaciones  de  examen? 
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TABLA  15.11  Rangos  y  calificaciones  de  examen  para  ocho  profesores 


Profesor 

Calificacion  de  juez 

Calificacion  de  examen 

1 

7 

44 

2 

4 

72 

3 

2 

69 

4 

6 

70 

5 

1 

93 

6 

3 

82 

7 

8 

67 

8 

5 

80 

Las  dos  variables  de  interes  son  calificacion  de  juez  y  calificacion  de  examen.  La 
primera  ya  esta  en  forma  de  rango  y  las  calificaciones  de  examen  se  pueden  ordenar 
de  manera  similar,  como  se  ve  en  la  tabla  15.12.  Las  calificaciones  para  observaciones 
empatadas  se  obtienen  al  promediar  las  calificaciones  que  habrfan  tenido  las  observa¬ 
ciones  empatadas  si  no  se  hubieran  observado  empates.  El  coeficiente  de  correlation  de 
rango  de  Spearman,  rs,  se  calcula  usando  los  rangos  de  las  mediciones  pareadas  en  las 
dos  variables  x  y  y  en  la  formula  para  r  (vease  el  capitulo  12). 

TABLA  15.12  Rangos  de  datos  de  la  tabla  15.1 1 


Profesor 

Calificacion  de  juez,  x, 

Calificacion  de  examen,  y: 

1 

7 

1 

2 

4 

5 

3 

2 

3 

4 

6 

4 

5 

1 

8 

6 

3 

7 

7 

8 

2 

8 

5 

6 

COEFICIENTE  DE  CORRELACION  DE  RANGO 
DE  SPEARMAN 


donde  x,  y  y,  representan  los  rangos  del  i-esimo  par  de  observaciones  y 

O  V.  -w  -  V  (2  v,)(2  y,) 

Sxy  =  2  (Xi  -  x)(yt  -  y)  =  2  x,y,-  - - 

n 


Sm  =  X  (x i  ~  xf  =  2  xf  -  ^ 

n 

c  V  /  — v  2  (2  yi) 

2yy  =  2  (yi  -  y)  =2  yt  - - 

n 


Cuando  no  haya  empates  en  las  x  observaciones  o  las  y  observaciones,  la 
expresion  para  rs  algebraicamente  se  reduce  a  la  expresion  mas  sencilla 


6  2  df 

n(n2  —  1) 


donde  d,  =  (x,  -  y,) 


Si  el  numero  de  empates  es  pequeno  en  comparacion  con  el  numero  de  pares  de 
datos,  resulta  un  pequeno  error  al  usar  esta  formula  breve. 
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Calcule  rs  para  los  datos  de  la  tabla  15.12. 


Solucion  Las  diferencias  y  cuadrados  de  diferencias  entre  las  dos  calificaciones  se 
dan  en  la  tabla  15.13.  Sustituyendo  valores  en  la  formula  para  r,,  tenemos 


=  1 


=  1 


6  X  df 

n{rC  —  1) 
6(144) 
8(64  -  1) 


-.714 


Diferencias  y  cuadrados  de  diferencias 
TABLA  15.13  para  las  calificaciones  del  profesor 


Profesor 

Xj 

Vi 

di 

4? 

1 

7 

1 

6 

36 

2 

4 

5 

-1 

1 

3 

2 

3 

-1 

1 

4 

B 

4 

2 

4 

5 

1 

8 

-7 

49 

6 

3 

7 

-4 

IB 

7 

8 

2 

6 

36 

8 

5 

6 

-1 

1 

Total  144 


El  coeficiente  de  correlation  de  rango  de  Spearman  se  puede  usar  como  estadfstico 
de  prueba  para  probar  la  hipotesis  de  que  no  haya  asociacion  entre  dos  poblaciones.  Se 
puede  suponer  que  los  n  pares  de  observaciones  (x„  y,)  han  sido  seleccionadas  al  azar  y, 
por  tanto,  ninguna  asociacion  entre  las  poblaciones  implica  una  asignacion  aleatoria  de 
los  n  rangos  dentro  de  cada  muestra.  Cada  asignacion  aleatoria  (para  las  dos  muestras) 
representa  un  evento  sencillo  asociado  con  el  experimento,  y  un  valor  de  rs  se  puede  calcu- 
lar  para  cada  una.  Entonces,  es  posible  calcular  la  probabilidad  de  que  rs  tome  un  valor 
absoluto  grande  debido  solo  a  una  probabilidad  y,  por  tanto,  sugiere  una  asociacion  entre 
poblaciones  cuando  no  existe  ninguna. 

La  region  de  rechazo  para  una  prueba  de  dos  colas  se  muestra  en  la  figura  15.12.  Si  la 
hipotesis  alternativa  es  que  la  correlation  entre  xy  y  sea  negativa,  se  rechazarfa  H0  para 
valores  negativos  de  rs  cercanos  a  —  1  (en  la  cola  inferior  de  la  figura  15.12).  Del  mismo 
modo,  si  la  hipotesis  alternativa  es  que  la  correlation  entre  xy  yes  positiva,  se  rechazarfa 
H0  para  valores  positivos  grandes  de  rs  (en  la  cola  superior  de  la  figura  15.12). 


FIGURA  15.12 

Region  de  rechazo  para 
una  prueba  de  dos  colas 
de  la  hipotesis  nula  de 
no  asociacion,  usando  la 
prueba  de  correlacion  de 
rango  de  Spearman 


1 

i 

1 

1  -/ 

0  0  ' 

0  1 

Region  de 

Region  de 

rechazo 

rechazo 

r  =  Coeficiente  de  correlacion  de  rango  de  Spearman 


Los  valores  crfticos  de  rs  se  dan  en  la  tabla  9  del  apendice  I.  Una  version  abreviada  se 
muestra  en  la  tabla  15.14.  En  sentido  horizontal  en  la  tabla  15.14  (y  la  tabla  9  del  apen¬ 
dice  I)  estan  los  valores  registrados  de  a  que  podrfan  usarse  para  una  prueba  de  una  cola 
de  la  hipotesis  nula  de  no  asociacion  entre  x  y  y.  El  numero  de  pares  de  rango  n  aparece 
en  el  lado  izquierdo  de  la  tabla.  Las  entradas  de  la  tabla  dan  el  valor  crftico  r0  para  una 
prueba  de  una  cola.  Entonces,  P(rs  >  r0)  =  a. 
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Por  ejemplo,  supongamos  que  tenemos  n  =  8  pares  de  rango  y  la  hipotesis  alternativa 
es  que  la  correlacion  entre  los  rangos  es  positiva.  Se  desearfa  rechazar  la  hipotesis  nula 
de  no  asociacion  solo  para  valores  positivos  grandes  de  rs  y  se  usarfa  una  prueba  de 
una  cola.  Si  se  consulta  la  tabla  15.14  y  se  usa  el  renglon  correspondiente  a  n  =  8  y  la 
columna  para  a  =  .05,  se  lee  r0  =  .643.  Por  tanto,  se  puede  rechazar  H0  para  todos  los 
valores  de  rs  may  ores  o  iguales  a  .643. 

La  prueba  se  realiza  exactamente  en  la  misma  forma  si  se  desea  probar  solo  la  hipo¬ 
tesis  alternativa  de  que  los  rangos  tienen  correlacion  negativa.  La  unica  diferencia  es 
que  se  rechazarfa  la  hipotesis  nula  si  rs  <  —.643.  Esto  es,  se  usa  el  negativo  del  valor 
tabulado  de  r0  para  obtener  el  valor  crftico  de  cola  inferior. 


Version  abreviada  de  la  tabla  9  del  apendice  I;  para  la  prueba 


de  correlacion  de  rango  de  Spearman 

n 

a  =  .05 

a  =  .025 

a  =  .01 

a  =  .005 

5 

.900 

— 

— 

— 

6 

.829 

.886 

.943 

— 

7 

.714 

.786 

.893 

— 

8 

.643 

.738 

.833 

.881 

9 

.600 

.683 

.783 

.833 

10 

.564 

.648 

.745 

.794 

11 

.523 

.623 

.736 

.818 

12 

.497 

.591 

.703 

.780 

13 

.475 

.566 

.673 

.745 

14 

.457 

.545 

15 

.441 

.525 

16 

.425 

17 

.412 

18 

.399 

19 

.388 

20 

.377 

Para  efectuar  una  prueba  de  dos  colas,  se  rechaza  la  hipotesis  nula  si  r,  >  r0  o  rs  < 
—  r0.  El  valor  de  a  para  la  prueba  es  el  doble  del  valor  que  se  ve  en  la  parte  superior  de 
la  tabla.  Por  ejemplo,  si  n  =  8  y  se  escoge  la  columna  .025,  se  rechaza  H0  si  rs  >  .738  o 
rs  <  —.738.  El  valor  a  para  la  prueba  es  2(.025)=  .05. 


PRUEBA  DE  CORRELACION  DE  RANGO 
DE  SPEARMAN 


1. 

2. 

3. 


Hipotesis  nula:  H0 :  No  hay  asociacion  entre  los  pares  de  rangos. 


Hipotesis  alternativa:  Hd :  Hay  asociacion  entre  los  pares  de  rangos  (una 
prueba  de  dos  colas);  o  bien,  H,  :  La  correlacion  entre  los  pares  de  rangos 
es  positiva  o  negativa  (una  prueba  de  una  cola). 


Estadfstico  de  prueba:  r,  = 


\'  S^y. 


donde  v,  y  y,  representan  las  bias  de  la  pareja  ith  de  las  observaciones. 


4.  Region  de  rechazo:  Para  una  prueba  de  dos  colas,  rechace  H0  se  r,>r0or,< 
—  r0,  donde  r0  se  da  en  la  tabla  9  del  apendice  I.  Duplique  la  probabilidad  tabu- 
lada  para  obtener  el  valor  de  a  para  la  prueba  de  dos  colas.  Para  una  prueba  de 
una  cola,  rechace  H0  si  rs  >  r0  (para  una  prueba  de  cola  superior)  or,<  —  r0 
(para  una  prueba  de  cola  inferior).  El  valor  a  para  una  prueba  de  una  cola  es  el 
valor  que  se  muestra  en  la  tabla  9  del  apendice  I. 
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Pruebe  la  hipotesis  de  que  no  hay  asociacion  entre  las  poblaciones  para  el  ejemplo 
15.10. 


Solucior  El  valor  crftico  de  rs  para  una  prueba  de  una  cola  con  a  =.05  y  n  =  8  es 
.643.  Se  puede  suponer  que  una  correlacion  entre  la  calificacion  del  juez  y  las  califica- 
ciones  de  examen  de  profesores  no  podrfan  ser  posiblemente  positivas.  (Una  calificacion 
baja  significa  buena  ensenanza  y  debe  estar  asociada  con  una  alta  calificacion  de  examen 
si  el  juez  y  la  prueba  miden  la  capacidad  de  ensenanza.)  La  hipotesis  alternativa  es  que 
el  coeficiente  de  correlacion  de  rango  poblacional  ps  es  menor  a  0  y  nos  interesa  una 
prueba  estadfstica  de  una  cola.  Entonces,  a  para  la  prueba  es  el  valor  tabulado  para  .05 
y  se  puede  rechazar  la  hipotesis  nula  si  rs  <  —.643. 

El  valor  calculado  del  estadfstico  de  prueba,  rs  =  —.714,  es  menor  que  el  valor  crfti¬ 
co  para  a  =  .05.  En  consecuencia,  la  hipotesis  nula  se  rechaza  al  nivel  de  significancia 
a  =  .05.  Es  evidente  que  existe  algun  acuerdo  entre  las  calificaciones  del  juez  y  las  califi- 
caciones  del  examen.  No  obstante,  debe  observarse  que  este  acuerdo  podrfa  existir  cuando 
ninguna  da  una  medida  adecuada  para  medir  la  capacidad  de  ensenanza.  Por  ejemplo,  la 
asociacion  podrfa  existir  si  el  juez  y  quienes  formularon  el  examen  de  profesores  tuvie- 
ran  un  concepto  erroneo,  pero  semejante,  de  las  caracterfsticas  de  la  buena  ensenanza. 


7,  Que  es  exactamente  lo  que  mide  rv?  El  coeficiente  de  correlacion  de  Spearman 
detecta  no  solo  una  relacion  lineal  entre  dos  variables,  sino  que  tambien  mide  cual- 
quier  otra  relacion  monotonica  (y  aumenta  cuando  x  aumenta  o  y  disminuye  cuando  x 
aumenta).  Por  ejemplo,  si  se  calculo  rs  para  los  dos  conjuntos  de  datos  de  la  tabla  15.15, 
ambos  producirfan  un  valor  de  rs  =  1  porque  los  rangos  asignados  para  x  y  y  en  ambos 
casos  concuerdan  para  todos  los  pares  (x,  y).  Es  importante  recordar  que  un  valor  sig¬ 
nificative  de  rs  indica  una  relacion  entre  x  y  y  que  es  creciente  o  decreciente,  pero  no 
necesariamente  lineal. 


TABLA  15.15  Conjuntos  de  datos  gemelos  con  rs  =  1 


- - - 

x  y=x1 

x  y=  Iog10(x) 

1  1 

10  1 

2  4 

100  2 

3  9 

1000  3 

4  16 

10000  4 

5  25 

100000  5 

6  36 

1  000000  6 

EJERCICIOS 


© 

TECNICAS  BASICAS 


1 5.43  De  la  region  de  rechazo  para  una  prueba  para 
detectar  correlacion  positiva  de  rango  si  el  numero  de 
pares  de  rangos  es  16  y  se  tienen  estos  valores  a: 

a.  a  =  .05  b.  a  =  .01 

1 5.44  De  la  region  de  rechazo  para  una  prueba  para 
detectar  correlacion  negativa  de  rango  si  el  numero  de 
pares  de  rangos  es  12  y  se  tienen  estos  valores  or. 

a.  a  =  .05  b .  a  =  .01 


1 5.45  De  la  region  de  rechazo  para  una  prueba  para 
detectar  correlacion  de  rango  si  el  numero  de  pares  de 
rangos  es  25  y  se  tienen  estos  valores  a: 

a.  a  =  .05  b .  a  =  .01 

15.46  Las  siguientes  observaciones  pareadas  se 
obtuvieron  en  dos  variables  xy  y: 


X 

1.2 

.8 

2.1 

3.5 

2.7 

1.5 

V 

1.0 

1.3 

.1 

-.8 

-.2 

.6 
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a.  Calcule  el  coeficiente  de  correlacion  de  rango  de 
Spearman  rs. 

b.  ^Los  datos  presentan  suficiente  evidencia  para  indicar 
una  correlacion  entre  x  y  y?  Pruebe  usando  a  =  .05. 

APLICACIONES 

datos  15.47  Calificacion  de  candidatos  politicos 

Un  politologo  deseaba  examinar  la  relacion 
entre  la  imagen  que  tiene  un  votante,  respecto  de 
un  candidato  politico  conservador  y  la  distancia  (en 
millas)  entre  las  residencias  del  votante  y  el  candidato. 
Cada  uno  de  12  votantes  califico  al  candidato  en  una 
escala  de  1  a  20. 


Votante 

Calificacion 

Distancia 

1 

12 

75 

2 

7 

165 

3 

5 

300 

4 

19 

15 

5 

17 

180 

6 

12 

240 

7 

9 

120 

8 

18 

60 

9 

3 

230 

10 

8 

200 

11 

15 

130 

12 

4 

130 

a.  Calcule  el  coeficiente  de  correlacion  de  rango  de 
Spearman  rs. 

b.  ^Estos  datos  dan  suficiente  evidencia  para  indicar  una 
correlacion  negativa  entre  calificacion  y  distancia? 

(^}datos  15.48  Carreras  de  competencia  ('.El 
numero  de  anos  de  experiencia  en  carreras 
de  competencia  esta  relacionado  con  el  rendimiento 
en  carreras  de  distancia  de  un  corredor?  Los  datos  de 
nueve  corredores,  obtenidos  de  un  estudio  hecho  por 
Scott  Powers  y  colegas,  se  dan  en  la  tabla  siguiente:5 


Corredor 

Anos  de  correr 
en  competencias 

Tiempo  de  llegada 
10  kilometros  (min) 

1 

9 

33.15 

2 

13 

33.33 

3 

5 

33.50 

4 

7 

33.55 

5 

12 

33.73 

6 

6 

33.86 

7 

4 

33.90 

8 

5 

34.15 

9 

3 

34.90 

a.  Calcule  el  coeficiente  de  correlacion  de  rango  entre 
anos  de  carreras  en  competencias  x  y  el  tiempo  y  de 
llegada  a  la  meta  en  una  carrera  de  10  kilometros. 

b.  (',Los  datos  dan  suficiente  evidencia  para  indicar  una 
correlacion  de  rango  entre  y  y  xl  Pruebe  usando 

a  =  .05. 


datos  15.49  ftaquetas  de  tenis  Los  datos  mostrados 
en  la  tabla  siguiente  dan  medidas  de  rigidez  al 
doblamiento  y  de  rigidez  al  torcimiento,  determinadas  por 
pruebas  de  ingenierfa  en  12  raquetas  de  tenis. 


Raqueta 

Rigidez  al 
doblamiento 

Rigidez  al 
torcimiento 

1 

419 

227 

2 

407 

231 

3 

363 

200 

4 

360 

211 

5 

257 

182 

6 

622 

304 

7 

424 

384 

8 

359 

194 

9 

346 

158 

10 

556 

225 

11 

474 

305 

12 

441 

235 

a.  Calcule  el  coeficiente  de  correlacion  de  rango  rs  entre 
rigidez  al  doblamiento  y  rigidez  al  torcimiento. 

b.  Si  una  raqueta  tiene  rigidez  al  doblamiento,  y.tambicn 
es  probable  que  tenga  rigidez  al  torcimiento?  Use  el 
coeficiente  de  correlacion  de  rango  para  determinar  si 
hay  una  relacion  positiva  significativa  entre  rigidez  al 
doblamiento  y  rigidez  al  torcimiento.  Use  a  =  .05. 

1 5.50  Calificaciones  de  estudiante  LI  director  de  una 
escuela  sospechaba  que  la  actitud  de  un  profesor,  hacia 
un  alumno  de  primer  ano,  dependfa  de  su  juicio  original 
de  la  capacidad  del  nino.  El  director  tambien  sospechaba 
que  mucho  de  ese  juicio  estaba  basado  en  la  calificacion 
del  coeficiente  de  inteligencia  (IQ)  del  alumno,  que  por 

lo  general  era  conocida  por  el  profesor.  Despues  de  tres 
semanas  de  ensenanza,  a  un  profesor  se  le  pidio  ordenara 
los  nueve  ninos  de  su  grupo  de  1  (la  mas  alta)  a  9  (la  mas 
baja)  en  cuanto  a  su  opinion  de  su  capacidad.  Calcule  rs 
para  estas  calificaciones  de  IQ  del  profesor: 

Profesor  1123456789 
IQ  Hi  1  2  4  5  7  9  6  8 

15.51  Calificaciones  de  estudiante,  continua 

Consulte  el  ejercicio  15.50.  ^Los  datos  dan  suficiente 
evidencia  para  indicar  una  correlacion  positiva  entre  las 
calificaciones  del  profesor  y  los  rangos  de  los  IQ? 

Use  a  =  .05. 

(^) datos  15.52  Criticos  de  arte  Doscriticos 
de  arte  calificaron  10  pinturas  de  artistas 
contemporaneos  (pero  anonimos),  de  acuerdo  con  su 
atractivo  a  los  criticos  respectivos.  Las  calificaciones  se 
ilustran  en  la  tabla  siguiente.  yLos  criticos  parecen  estar 
de  acuerdo  en  sus  calificaciones  de  arte  contemporaneo? 
Es  decir,  ^los  datos  dan  suficiente  evidencia  para  indicar 
una  correlacion  positiva  entre  los  criticos  A  y  B?  Pruebe 
usando  un  valor  a  de  .05  o  cercano  a  este. 
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Pintura 


Critico  A 


Critico  B 


1 

2 

3 

4 

5 

6 

7 

8 
9 

10 


6 

4 
9 
1 
2 

7 
3 

8 

5 
10 


5 

6 
10 

2 

3 
8 
1 
7 

4 
9 


(^)datos  15.53  Calificacion  de  hojas  de  tabaco  Se 

realizo  un  experimento  para  estudiar  la  relacion 
entre  las  calificaciones  de  un  experto  en  clasificar 
hojas  de  tabaco  y  el  contenido  de  humedad  de  las  hojas. 
Doce  de  estas  fueron  calificadas  por  el  experto 
en  una  escala  de  1  a  10  y  se  tomaron  las  lecturas 
correspondientes  del  contenido  de  humedad. 

Hoja  Calificacion  del  experto  Contenido  de  humedad 


2 

3 

4 

5 

6 

7 

8 
9 

10 

11 

12 


9 

6 

7 

7 

5 

8 
2 

6 
1 

10 

9 

3 


.22 

.16 

.17 

.14 

.12 

.19 

.10 

.12 

.05 

.20 

.16 

.09 


Calcule  rs.  (-,Los  datos  dan  suficiente  evidencia  para 
indicar  una  asociacion  entre  las  calificaciones  del  experto 
y  el  contenido  de  humedad  de  las  hojas? 

(^)oatos  15.54  Educacion  en  conductas  sociales 

Se  implemento  un  programa  de  educacion  en 
conductas  sociales,  con  siete  estudiantes  a  un  mediano 
grado  de  dificultad,  para  determinar  si  el  programa 
causaba  mejoras  en  medidas  de  antes  y  despues  de 
examen,  asf  como  en  calificaciones  de  conducta.  Para 
uno  de  estos  examenes,  las  calificaciones  de  antes  y 
despues  de  examen  para  los  siete  estudiantes  se  dan  en  la 
tabla  siguiente: 


Estudiante 


Antes 


Despues 


Earl 

101 

113 

Ned 

89 

89 

Jasper 

112 

121 

Charlie 

105 

99 

Tom 

90 

104 

Susie 

91 

94 

Lori 

89 

99 

a.  Use  una  prueba  no  parametrica  para  determinar 
si  hay  una  relacion  positiva  significativa  entre  las 
calificaciones  de  antes  y  despues  de  examen. 

b.  (',Estos  resultados  concuerdan  con  los  resultados  de  la 
prueba  parametrica  del  ejercicio  12.51? 


RESUMEN 


Las  pruebas  no  parametricas  presentadas  en  este  capftulo  son  solo  algunas  de  las  nume- 
rosas  pruebas  no  parametricas  disponibles  para  los  experimentadores.  Las  pruebas 
presentadas  aquf  son  aquellas  para  las  que  hay  tablas  de  valores  criticos  disponibles 
facilmente. 

Los  metodos  estadisticos  no  parametricos  son  especialmente  utiles  cuando  las  obser- 
vaciones  se  pueden  ordenar  pero  no  colocar  exactamente  en  una  escala  de  mediciones. 
Tambien,  los  metodos  no  parametricos  son  los  unicos  que  se  pueden  usar  cuando  se  hayan 
apegado  correctamente  a  los  disenos  de  muestreo,  pero  los  datos  no  se  supone  que  sigan  o 
no  se  puede  suponer  que  sigan  una  o  mas  suposiciones  de  distribution  prescritas. 

Hemos  presentado  una  amplia  variedad  de  tecnicas  no  parametricas,  que  se  pue¬ 
den  usar  cuando  los  datos  no  estan  normalmente  distribuidos,  o  las  otras  suposiciones 
requeridas  no  se  satisfacen.  En  la  literatura  existen  procedimientos  de  una  muestra;  sin 
embargo,  nos  hemos  concentrado  en  analizar  dos  o  mas  muestras  que  han  sido  correc¬ 
tamente  seleccionadas  usando  muestreo  aleatorio  e  independiente,  como  lo  requiere  el 
diseno  de  que  se  trate.  Los  analogos  no  parametricos  de  los  procedimientos  parametricos 
presentados  en  los  capitulos  10-14  son  sencillos  y  muy  faciles  de  poner  en  practical 


•  La  prueba  de  suma  de  rango  de  Wilcoxon  es  el  analogo  no  parametrico  de  la 
prueba  t  de  dos  muestras. 

•  La  prueba  del  signo  y  las  pruebas  de  rango  con  signo  de  Wilcoxon  son  los 
analogos  no  parametricos  de  la  prueba  t  de  muestra  pareada. 
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•  La  prueba  H  de  Kruskal-Wallis  es  el  rango  equivalente  al  analisis  de  varianza 
de  una  via  de  la  prueba  F. 

•  La  prueba  Fr  de  Friedman  es  el  rango  equivalente  del  analisis  de  varianza  de  dos 
vias  del  diseno  aleatorizado  de  bloques  de  la  prueba  F. 

•  El  rs  de  correlation  de  rango  de  Spearman  es  el  rango  equivalente  al  coeficiente 
de  correlation  de  Pearson. 

Estos  y  muchos  mas  procedimientos  no  parametricos  estan  disponibles  como  alter- 
nativas  a  las  pruebas  parametricas  presentadas  anteriormente.  Es  importante  tener  en 
cuenta  que  cuando  los  supuestos  necesarios  de  las  poblaciones  muestreadas  estan  relaja- 
das,  nuestra  capacidad  para  detectar  diferencias  significativas  en  una  o  mas  caracterfsti- 
cas  de  la  poblacion  disminuye. 


REPASO  DEL  CAPITULO 


Concept 059  y  formulas  clave 

I.  Metodos  no  parametricos 

1 .  Estos  metodos  se  utilizan  cuando  los  datos  no  se 
pueden  medir  en  una  escala  cuantitativa,  o  cuando 

2.  La  escala  numerica  de  mediciones  sea  fijada 
arbitrariamente  por  el  investigador,  o  bien,  cuando 

3.  Las  suposiciones  parametricas  tales  como 
normalidad  o  varianza  constante  sean  violadas 
gravemente. 

II.  Prueba  de  la  suma  de  rango 

de  Wilcoxon:  muestras 

aleatorias  independientes 

1.  Conjuntamente  ordene  las  dos  muestras.  Designe 
la  muestra  mas  pequena  como  muestra  1 . 

Entonces 

7i  =  Suma  de  rango  de  la  muestra  1 
T\  =  nx(nx  +  n2  +  1)  —  7i 

2.  Use  7i  para  probar  si  la  poblacion  1  esta  a 
la  izquierda  de  la  poblacion  2.  Use  para 
probar  si  la  poblacion  1  esta  a  la  derecha  de  la 
poblacion  2.  Use  la  menor  de  7i  y  T\  para  probar 
si  hay  diferencia  en  las  ubicaciones  de  las  dos 
poblaciones. 

3.  La  tabla  7  del  apendice  I  tiene  valores  criticos 
para  el  rechazo  de  H0. 

4.  Cuando  los  tamanos  muestrales  sean  grandes,  use 
la  aproximacion  normal: 

fii(rii  +  «2  +  1) 

Mr-  ~ 

2  npi^tni  +  n2  +  1) 
cr  t  — 

12 

T  —  Mr 

z  = - 

cr j 


III.  Prueba  del  signo  para  un  experimento 

pareado 

1 .  Encuentre  x,  el  numero  de  veces  que  la 
observation  A  exceda  de  la  observation  B  para  un 
par  determinado. 

2.  Para  probar  si  hay  diferencia  en  dos  poblaciones, 
pruebe  H0  :  p  =  .5  contra  una  alternativa  de  una 
o  de  dos  colas. 

3.  Use  la  tabla  1  del  apendice  I  para  calcular  el  valor 
p  para  la  prueba. 

4.  Cuando  los  tamanos  muestrales  sean  grandes, 
use  la  aproximacion  normal: 

_  x  —  .5 n 
,5\Fn 

IV.  Prueba  de  rango  con  signo  de 

Wilcoxon:  experimento  pareado 

1 .  Calcule  las  diferencias  en  las  observaciones 
pareadas.  Ordene  los  valores  absolutos 

de  las  diferencias.  Calcule  las  sumas  de 
rango  Uyf  -  para  las  diferencias  positivas 
y  negativas,  respectivamente.  La  estadfstica 
de  prueba  T  es  la  menor  de  las  dos  sumas  de 
rango. 

2.  La  tabla  8  del  apendice  I  tiene  valores  criticos 
para  el  rechazo  de  H0  para  pruebas  de  una  y  de 
dos  colas. 

3.  Cuando  los  tamanos  muestrales  sean  grandes,  use 
la  aproximacion  normal: 

T+  -  [n(n  +  l)/4] 

VMm  +  1)(2/J  +  l)]/24 
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V.  Prueba  H  de  Kruskal-Wallis:  diseno 
completamente  aleatorizado 


1.  Conjuntamente  ordene  las  n  observaciones 
de  las  k  muestras.  Calcule  las  sumas  de  rango, 

Tt  =  suma  de  rango  de  la  muestra  i  y  el  estadfstico 
de  prueba 


H  = 


12 

n(n  +  1) 


X 


T2 

— -  3  (n  +  1) 

n-i 


2.  Si  la  hipotesis  nula  de  igualdad  de  distribuciones 
es  falsa,  77  sera  inusualmente  grande,  resultando 
en  una  prueba  de  una  cola. 

3.  Para  tamanos  muestrales  de  cinco  o  mayores, 
la  region  de  rechazo  para  77  esta  basada  en  la 
distribucion  ji  cuadrada  con  (k  —  I )  grados  de 
libertad. 


VI.  Prueba  Fr  de  Friedman:  diseno 
aleatorizado  de  bloques 

1 .  Ordene  las  respuestas  dentro  de  cada  bloque  de  1 
a  k.  Calcule  las  sumas  de  rango,  7’,,  7’2,  ...,  Tk,  y 
el  estadfstico  de  prueba 


F  = 


12 


bk(k  +  1) 


X  T2  -  3 b(k  +  1) 


3.  Para  tamanos  de  bloques  de  cinco  o  mayores, 
la  region  de  rechazo  para  Fr  esta  basada  en  la 
distribucion  ji  cuadrada  con  (k  —  1)  grados  de 
libertad. 

VII.  Coeficiente  de  correlacion  de  rango 

de  Spearman 

1 .  Ordene  las  respuestas  para  las  dos  variables  de 
menor  a  mayor. 

2.  Calcule  el  coeficiente  de  correlacion  para  las 
observaciones  ordenadas: 

,  6  X  d2 

r.  =  — ,  o  r,  =  I - ^ - 

\J  SJSyy  n(n  -  1) 

si  no  hay  empates 

3.  La  tabla  9  del  apendice  I  da  valores  crfticos 
para  correlaciones  de  rango  significativamente 
diferentes  de  0. 

4.  El  coeficiente  de  correlacion  de  rango  detecta 

no  solo  correlacion  lineal  significativa  sino  tambien 
cualquier  otra  relacion  monotonica  entre  las  dos 
variables. 


2.  Si  la  hipotesis  nula  de  igualdad  de  distribuciones 
de  tratamiento  es  falsa,  Fr  sera  inusualmente 
grande,  resultando  en  una  prueba  de  una  cola. 


Procedimientos  no  parametricos 


Numerosos  procedimientos  no  parametricos  estan  disponibles  en  el  paquete  MINITAB, 
incluyendo  la  mayor  parte  de  las  pruebas  estudiadas  en  este  capftulo.  Los  cuadros  de 
dialogo  son  conocidos  para  el  usuario  por  ahora  y  veremos  las  pruebas  en  el  orden  pre- 
sentado  en  el  capftulo. 

Para  poner  en  practica  la  prueba  de  la  suma  de  rango  de  Wilcoxon  para  dos  muestras 
aleatorias  independientes,  introduzca  los  dos  conjuntos  de  datos  muestrales  en  dos  co- 
lumnas  (por  ejemplo,  Cl  y  C2)  de  la  hoja  de  trabajo  MINITAB.  El  cuadro  de  dialogo  de  la 
figura  15.13  se  genera  usando  Stat  — »  Nonparametrics  —>  Mann- Whitney.  Seleccione 
C 1  y  C2  para  la  First  y  Second  Samples  e  indique  el  coeficiente  de  confianza  apropiado 
(para  un  intervalo  de  confianza)  e  hipotesis  alternativa.  A1  hacer  clic  en  OK  se  genera 
la  salida  de  la  figura  15.1. 

La  prueba  del  signo  y  la  prueba  de  rango  con  signo  de  Wilcoxon  para  muestras  pa- 
readas  se  efectuan  exactamente  en  la  misma  forma,  con  un  cambio  solo  en  el  ultimo 
comando  de  la  secuencia.  Incluso  los  cuadros  de  dialogo  son  identicos.  Introduzca  los 
datos  en  dos  columnas  de  la  hoja  de  trabajo  MINITAB  (usamos  los  datos  de  mezcla  de 
pastel  en  la  seccion  15.5).  Antes  que  se  pueda  implementar  cada  prueba,  se  debe  ge- 
nerar  una  columna  de  diferencias  usando  Calc  — »  Calculator,  como  se  ve  en  la  figura 
15.14.  Use  Stat  —*  Nonparametrics  — >  1-Sample  Sign  o  Stat  — >  Nonparametrics  — » 


www.FreeLibros.me 


Ml  MINITAB  O  669 


FIGURA  15.13 


FIGURA  1  5.14 


1-Sample  Wilcoxon  para  generar  el  cuadro  de  dialogo  apropiado  que  se  ve  en  la  fi- 
gura  15.15.  Recuerde  que  la  mediana  es  el  valor  de  una  variable  tal  que  50%  de  los 
valores  son  mas  pequenos  y  50%  son  mas  grandes.  En  consecuencia,  si  las  dos  distribu- 
ciones  poblacionales  son  iguales,  la  mediana  de  las  diferencias  sera  0.  Esto  es  equiva- 
lente  a  la  hipotesis  nula 

H0 :  P(diferencia  positiva)  =  AYdiferencia  negativa)  =  .5 


www.FreeLibros.me 


670  O  CAPITULO  15  ESTADlSTICAS  NO  PARAMETRICAS 


FIGURA  15.15 


empleada  para  la  prueba  del  signo.  Seleccione  la  columna  de  diferencias  para  la  caja 
Variables  y  seleccione  la  mediana  de  prueba  igual  a  0  con  la  alternativa  apropiada.  De 
un  clic  en  OK  para  obtener  la  salida  impresa  de  cualquiera  de  las  dos  pruebas.  La  salida 
impresa  de  ventana  para  la  prueba  del  signo,  ilustrada  en  la  figura  15.16,  indica  una 
diferencia  no  significativa  en  las  distribuciones  de  densidades  para  las  dos  mezclas  de 
pastel.  Observe  que  el  valor  p  (.2188)  no  es  igual  que  el  valor  p  para  la  prueba  de  rango 
con  signo  de  Wilcoxon  (.093  de  la  figura  15.4).  No  obstante,  si  se  prueba  al  nivel  de  5%, 
ambas  pruebas  producen  diferencias  no  significativas. 
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Los  procedimientos  para  implementar  la  prueba  H  de  Kruskal-Wallis  para  k  muestras 
independientes  y  la  prueba  Fr  de  Friedman  para  un  diseno  aleatorizado  de  bloques,  son 
identicos  a  los  procedimientos  empleados  para  sus  equivalentes  parametricos.  Repase 
los  metodos  descritos  en  la  seccion  “Mi  MINITAB”  del  capttulo  11.  Una  vez  que  haya 
introducido  los  datos  como  se  explica  en  esa  seccion,  los  comandos  Stat  — >  Nonpara- 
metrics  — »  Kruskal-Wallis  o  Stat  — »  Nonparametrics  —*■  Friedman  van  a  general-  un 
cuadro  de  dialogo  en  el  que  el  usuario  especifica  la  columna  de  respuesta  y  la  columna 
del  factor  o  la  columna  de  respuesta,  la  columna  del  tratamiento  y  la  columna  de  bloque, 
respectivamente.  De  un  clic  en  OK  para  obtener  las  salidas  impresas  para  estas  pruebas 
no  parametricas. 
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Finalmente,  se  puede  generar  el  coeficiente  no  parametrico  de  correlation  de  rango  r, 
si  se  introducen  los  datos  en  dos  columnas  y  se  ordenan  los  datos  usando  Data  — »  Rank. 
Por  ejemplo,  los  datos  sobre  la  calificacion  del  juez  y  las  calificaciones  del  examen  se 
introdujeron  en  las  columnas  C6  y  C7  de  nuestra  hoja  de  calculo  MINITAB.  Como  las 
calificaciones  del  juez  ya  estan  ordenadas,  solo  necesitamos  ordenar  C7  al  seleccionar 
“Exam  Score”  y  guardar  los  rangos  en  C8  [llamada  “Rank  (y)”  en  la  figura  15.17].  Los 
comandos  Stat  — >  Basic  Statistics  — >  Correlation  produciran  ahora  el  coeficiente  de  co¬ 
rrelacion  de  rango  cuando  C6  y  C8  se  seleccionen.  No  obstante,  el  valor  p  que  se  ve  en 
la  salida  no  produce  exactamente  la  misma  prueba  que  los  valores  crfticos  de  la  tabla 
15.14.  Debe  compararse  el  valor  de  rs  obtenido  por  el  usuario  con  el  valor  tabulado  para 
comprobar  si  hay  una  asociacion  significativa  entre  las  dos  variables. 


FIGURA  15.17 


EJercicios  suplementarios 


(^)datos  15.55  Tiempos  de  respuesta  Serealizoun 
experimento  para  comparar  los  tiempos  de 
respuesta  para  dos  estfmulos  diferentes.  Para  eliminar 
la  natural  variabilidad  de  una  persona  a  otra  en  las 
respuestas,  ambos  estfmulos  se  presentaron  a  cada  una 
de  nueve  personas,  permitiendo  asf  un  analisis  de  las 
diferencias  entre  estfmulos  dentro  de  cada  persona. 

La  tabla  es  una  lista  de  tiempos  de  respuesta  (en 
segundos). 

Persona  Estimulo  1  Estimulo  2 


1 

9.4 

10.3 

2 

7.8 

8.9 

3 

5.6 

4.1 

4 

12.1 

14.7 

5 

6.9 

8.7 

6 

4.2 

7.1 

7 

oq 

CO 

11.3 

8 

7.7 

5.2 

9 

6.4 

7.8 

EX1 


a.  Use  la  prueba  del  signo  para  determinar  si  existe 
suficiente  evidencia  para  indicar  una  diferencia  en  los 
tiempos  medios  de  respuesta  para  los  dos  estfmulos. 
Use  una  region  de  rechazo  para  la  cual  a  <  .05. 

b.  Pruebe  la  hipotesis  de  que  no  hay  diferencia  en 
tiempos  medios  de  respuesta  usando  la  prueba  t  de 
Student. 

15.56  Tiempos  de  respuesta,  continua  Consulte 
el  ejercicio  15.55.  Pruebe  la  hipotesis  de  que  no  hay 
diferencia  en  las  distribuciones  de  tiempos  de  respuesta 
para  los  dos  estfmulos,  usando  la  prueba  del  rango  con 
signo  de  Wilcoxon.  Use  una  region  de  rechazo  para  la 
cual  a  sea  tan  cercana  como  sea  posible  a  la  a  obtenida 
en  el  ejercicio  15.55,  inciso  a). 

datos  15.57  Gemelos  identicos  Para  comparar 
dos  escuelas  secundarias,  A  y  B,  en  efectividad 
academica,  se  diseno  un  experimento  que  requerfa  el  uso 
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de  10  pares  de  gemelos  identicos,  donde  cada  gemelo 
acababa  de  terminar  el  sexto  grado.  En  cada  caso,  los 
gemelos  del  mismo  par  hablan  tenido  su  ensenanza  en 
los  mismos  salones  de  clase  en  cada  nivel  de  grado.  Un 
nino  fue  seleccionado  al  azar  de  cada  par  de  gemelos 
y  asignado  a  la  escuela  A.  Los  demas  ninos  fueron 
enviados  a  la  escuela  B.  Cerca  del  final  del  noveno  grado, 
se  aplico  cierto  examen  de  aprovechamiento  a  cada  nino 
del  experimento.  Las  calificaciones  del  examen  se  ven  en 
la  tabla  siguiente. 


Par  de  gemelos 

Escuela  A 

Escuela  B 

1 

67 

39 

2 

80 

75 

3 

65 

69 

4 

70 

55 

5 

86 

74 

6 

50 

52 

7 

63 

56 

8 

81 

72 

9 

86 

89 

10 

60 

47 

a.  Pruebe  (usando  la  prueba  del  signo)  la  hipotesis 
de  que  las  dos  escuelas  son  iguales  en  efectividad 
academica,  medida  por  calificaciones  en  el  examen 
de  aprovechamiento,  contra  la  alternativa  de  que  las 
escuelas  no  son  igualmente  efectivas. 

b.  Suponga  que  se  sabe  que  la  escuela  secundaria  A 
tenia  un  mejor  profesorado  y  mejores  instalaciones 
de  ensenanza.  Pruebe  la  hipotesis  de  igual  efectividad 
academica  contra  la  alternativa  de  que  la  escuela  A  es 
superior. 

15.58  Gemelos  identicos  Consulte  el  ejercicio 
15.57.  7,  Que  respuestas  se  obtienen  si  se  usa  la  prueba 
de  rango  con  signo  de  Wilcoxon  para  analizar  los  datos? 
Compare  con  sus  respuestas  anteriores. 

(^)datos  15.59  Brillantez  de  papel  Losvalores 

codificados  para  una  medida  de  la  brillantez  del 
papel  (reflectividad  ligera),  preparados  por  dos  procesos 
diferentes,  se  dan  en  la  tabla  para  muestras  de  nueve 
observaciones  tomadas  al  azar  de  cada  uno  de  los  dos 
procesos.  ^Los  datos  presentan  suficiente  evidencia  para 
indicar  una  diferencia  en  las  mediciones  de  la  brillantez 
para  los  dos  procesos?  Use  una  prueba  parametrica  y  una 
no  parametrica  y  compare  sus  resultados. 


Proceso 

Brillantez 

A 

6.1 

9.2 

1 — • 

CO 

8.9  7.6  7.1 

9.5 

8.3 

9.0 

B 

9.1 

8.2 

8.6 

6.9  7.5  7.9 

8.3 

7.8 

8.9 

15.60  Instrumentos  de  precision  Suponga  (como 
en  el  caso  de  mediciones  producidas  por  instrumentos 
de  medicion  bien  calibrados)  que  las  medias  de  dos 
poblaciones  son  iguales.  Use  el  estadistico  de  la  suma  de 
rango  de  Wilcoxon  para  probar  hipotesis  respecto  a  las 
varianzas  poblacionales  como  sigue: 


a.  Ordene  la  muestra  combinada. 

b.  Numere  las  observaciones  ordenadas  “de  afuera 
hacia  adentro”;  esto  es,  numere  la  observation  1  mas 
pequena,  la  mayor  2,  la  siguiente  a  la  mas  pequena  3, 
la  siguiente  a  la  mas  grande  4,  y  asf  sucesivamente. 
Esta  secuencia  de  numeros  induce  un  ordenamiento 
en  los  simbolos  A  (objetos  de  la  poblacion  A)  y  B 
(objetos  de  la  poblacion  B).  Si  ar\  >  cr2B,  uno  se 
esperarfa  hallar  una  preponderancia  de  las  A  cercana  a 
la  primera  de  las  secuencia  y  asi  una  “suma  de  rangos” 
relativamente  pequena  para  las  observaciones  A. 

c.  Dadas  las  mediciones  de  la  tabla  producidas  por  los 
instrumentos  de  precision  bien  calibrados  A  y  B,  pruebe 
cerca  del  nivel  a  =  .05  para  determinar  si  el  instrumento 
B  mas  costoso  es  mas  preciso  que  el  A.  (Observe  que 
esto  implica  una  prueba  de  una  cola.)  Use  el  estadistico 
de  prueba  de  la  suma  de  rango  de  Wilcoxon. 

Instrumento  A  Instrumento  B 


1060.21 

1060.24 

1060.34 

1060.28 

1060.27 

1060.32 

1060.36 

1060.30 

1060.40 

d.  Pruebe  usando  la  igualdad  de  varianza  de  la  prueba  F. 

datos  15.61  Suavizadores  de  carne  Serealizo 
un  experimento  para  comparar  la  suavidad  de 
cortes  de  carne  con  dos  suavizadores  de  carne  diferentes, 
A  y  B.  Para  reducir  el  efecto  de  variables  extranas,  los 
datos  fueron  pareados  por  el  corte  de  carne  especifico 
al  aplicar  los  suavizadores  a  dos  cortes  tornados  de  la 
misma  res,  al  cocinar  cortes  pareados  juntos  y  usar  un 
solo  juez  para  cada  par.  Despues  de  la  coccion,  cada  corte 
fue  calificado  por  un  juez  en  una  escala  de  1  a  10,  con 
un  10  correspondiente  a  la  carne  mas  suave.  Los  datos 
se  muestran  para  un  solo  juez.  ^Los  datos  dan  suficiente 
evidencia  para  indicar  que  uno  de  los  suavizadores  tiende 
a  recibir  calificaciones  mas  altas  que  el  otro?  La  prueba  t 
de  Student  seria  mas  apropiada  para  analizar  estos  datos 
Explique. 

Suavizador 


Corte  A  B 


Asado  de  paletilla  5  7 

Asado  de  lomo  6  5 

Filete  de  costilla  8  9 

Pecho  4  5 

Filete  9  9 

Filete  bola  3  5 

Asado  de  pierna  7  6 

Solomillo  8  8 

Puntas  de  solomillo  8  9 

Chuleta  9  10 


(^)datos  15.62  Entrevista  a  prospectos  de  trabajo 
Una  gran  empresa  selecciona  graduados 
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universitarios  para  un  empleo  usando  tanto  entrevistas 
como  una  prueba  psicologica  de  aprovechamiento.  Las 
entrevistas  efectuadas  en  la  casa  matriz  de  la  companfa 
son  mucho  mas  costosas  que  las  que  se  puedan  efectuar 
en  el  plantel.  En  consecuencia,  la  oficina  de  personal 
estaba  interesada  en  determinar  si  las  calificaciones  de 
examen  estaban  correlacionadas  con  calificaciones 
de  entrevistas  y  si  las  pruebas  podrfan  ser  sustituidas  por 
entrevistas.  La  idea  era  no  eliminar  las  entrevistas  sino 
reducir  su  numero.  Para  determinar  si  las  medidas 
estaban  correlacionadas,  se  calificaron  10  prospectos 
durante  entrevistas  y  se  examinaron.  Las  calificaciones 
pareadas  se  dan  a  continuacion: 


Persona 

Calificacion  de  entrevista 

Calificacion  de  examen 

1 

8 

74 

2 

5 

81 

3 

10 

66 

4 

3 

83 

5 

6 

66 

6 

1 

94 

7 

4 

96 

8 

7 

70 

9 

9 

61 

10 

2 

86 

Calcule  el  coeficiente  de  correlacion  de  rango  de 
Spearman  r„.  La  calificacion  1  se  asigna  al  candidato 
juzgado  como  el  mejor. 

15.63  Intrevistas,  continua  Consulte  el  ejercicio 
15.62.  6Los  datos  presentan  suficiente  evidencia  para 
indicar  que  la  correlacion  entre  las  calificaciones  de 
entrevista  y  las  calificaciones  de  examen  es  menor  a  cero? 
Si  esta  evidencia  existe,  (:,se  puede  decir  que  los  examenes 
se  pueden  usar  para  reducir  el  numero  de  entrevistas? 

15.64  Experimentos  de  asociacion  de  palabras 

Una  comparacion  de  tiempos  de  reaccion,  para  dos 
estfmulos  diferentes  en  un  experimento  psicologico  de 
asociacion  de  palabras,  produjo  los  resultados  siguientes 
cuando  se  aplico  a  una  muestra  aleatoria  de  16  personas: 


Estimulo 

Tiempo  de  reaccion  (segundos) 

1 

2 

1 

4 

3  2  12  13  2 

2  3  3  1  2  3  3 

7,  Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  tiempos  medios  de  reaccion  para 
los  dos  estfmulos?  Use  una  prueba  apropiada,  no 
parametrica,  y  explique  sus  conclusiones. 

datos  15.65  Matematicas  y  arte  La  tabla  muestra 
las  calificaciones  de  un  grupo  de  15  estudiantes 
en  matematicas  y  arte.  Use  la  prueba  de  rango  con 
signo  de  Wilcoxon  para  determinar  si  las  calificaciones 
medianas  para  estos  estudiantes  difiere  significativamente 
para  las  dos  materias. 


Estudiante  Matematicas 

Arte 

Estudiante 

Matematicas 

Arte 

1 

22 

53 

9 

62 

55 

2 

37 

68 

10 

65 

74 

3 

36 

42 

11 

66 

68 

4 

38 

49 

12 

56 

64 

5 

42 

51 

13 

66 

67 

6 

58 

65 

14 

67 

73 

7 

58 

51 

15 

62 

65 

8 

60 

71 

15.66 

Matematicas 

y  arte 

,  continua 

Consulte  el 

ejercicio  15.65.  Calcule  el  coeficiente  de  correlacion 
de  rango  de  Spearman  para  estos  datos  y  pruebe  H0  : 
no  hay  asociacion  entre  los  pares  ordenados  al  nivel  de 
significancia  de  10%. 

15.67  Produccion  de  trigo  El  ejercicio  1 1 .68 
presento  un  analisis  de  varianza  de  las  producciones  de 
cinco  variedades  diferentes  de  trigo,  observadas  en  un 
terreno  cada  una,  en  cada  uno  de  seis  lugares  diferentes 
(vease  el  conjunto  de  datos  EX1 168).  Los  datos  de  este 
diseno  aleatorizado  de  bloques  se  dan  a  continuacion: 


Lugar 


Variedades 

1 

2 

3 

4 

5 

6 

A 

35.3 

31.0 

32.7 

36.8 

37.2 

33.1 

B 

30.7 

32.2 

31.4 

31.7 

35.0 

32.7 

C 

38.2 

33.4 

33.6 

37.1 

37.3 

38.2 

D 

34.9 

36.1 

35.2 

38.3 

40.2 

36.0 

E 

32.4 

28.9 

29.2 

30.7 

33.9 

32.1 

a.  Use  la  prueba  no  parametrica  apropiada  con  el  fin  de 
determinar  si  los  datos  aportan  suficiente  evidencia  para 
indicar  una  diferencia  en  las  producciones,  para  las  cinco 
diferentes  variedades  de  trigo.  Pruebe  usando  a  =  .05. 

b.  El  ejercicio  1 1 .68  presento  una  salida  impresa  de  compu- 
tadora  del  analisis  de  varianza  para  comparar  las  produc¬ 
ciones  medias  para  las  cinco  variedades  de  trigo.  ^Como 
se  comparan  los  resultados  del  analisis  de  varianza  de  la 
prueba  F  con  la  prueba  del  inciso  a)?  Explique. 

15.68  Aprendiendo  a  vender  En  el  ejercicio  11.61 
se  compararon  los  numeros  de  ventas  por  estudiante, 
despues  de  terminar  uno  de  cuatro  programas  diferen¬ 
tes  de  capacitacion  en  ventas  (vease  el  conjunto  de 
datos  EX1161).  Seis  estudiantes  completaron  el 
programa  de  capacitacion  1 ,  ocho  completaron  el  2,  y  asf 
sucesivamente.  Los  numeros  de  ventas  por  estudiante 
se  muestran  en  la  tabla  siguiente. 

Programa  de  capacitacion 


12  3  4 


78 

99 

74 

81 

84 

86 

87 

63 

86 

90 

80 

71 

92 

93 

83 

65 

69 

94 

78 

86 

73 

85 

79 

97 

73 

91 

70 

Total 

482 

735 

402 

588 
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a.  7,  Los  datos  presentan  suficiente  evidencia  para  indicar 
que  la  distribution  de  numero  de  ventas  por  estudiante 
difiere  de  un  programa  de  capacitacion  a  otro? 
Determine  usando  la  prueba  no  parametrica  apropiada. 

b.  ^Como  se  comparan  los  resultados  de  la  prueba  del 
inciso  a  con  los  resultados  del  analisis  de  varianza  de 
la  prueba  F  del  ejercicio  11.61? 


15.69  Contamination  de  plantas  de  productos 

quimicos  En  el  ejercicio  1 1.66  efectuamos  un 
analisis  de  varianza  para  comparar  los  niveles  medios 
de  descargas  residuales  en  agua,  en  cuatro  plantas 
industriales  diferentes  (vease  el  conjunto  de  datos 
EX1 166).  Se  tomaron  cinco  muestras  del  desecho  llquido 
a  la  salida  de  cada  una  de  las  cuatro  plantas  industriales; 
los  datos  se  muestran  en  la  tabla  siguiente. 


Planta 


Descargas  contaminantes  (Ib/gal  de  desechos) 


A 

1.65 

1.72 

1.50 

1.37 

1.60 

B 

1.70 

1.85 

1.46 

2.05 

1.80 

C 

1.40 

1.75 

1.38 

1.65 

1.55 

D 

2.10 

1.95 

1.65 

1.88 

2.00 

a.  7  Los  datos  presentan  suficiente  evidencia  para  indicar 
una  diferencia  en  los  niveles  de  contaminantes  para  las 
cuatro  plantas  industriales  diferentes?  Pruebe  usando 
la  prueba  no  parametrica  apropiada. 

b.  Encuentre  el  valor  p  aproximado  para  la  prueba  e 
interprete. 

c.  Compare  los  resultados  de  la  prueba  del  inciso  a) 
con  el  analisis  de  varianza  del  ejercicio  1 1.66. 

7  Los  resultados  concuerdan?  Explique. 


15.70  Investigation  del  sida  Unos  cientlficos  han 
demostrado  que  una  vacuna  recien  inventada  puede 
proteger  a  monos  Rhesus  contra  infecciones  causadas 
por  un  virus  estrechamente  relacionado  con  el  virus 
de  inmunodeficiencia  humana  (VIH)  causante  del 
sida.  En  su  trabajo,  Ronald  C.  Resrosiers  y  sus  colegas 
del  Centro  Regional  de  Investigation  de  Primates  de 
Nueva  Inglaterra,  aplicaron  a  cada  uno  de  n  =  6  monos 
Rhesus  cinco  inoculaciones  con  la  vacuna  del  virus  de 
inmunodeficiencia  de  simios  (VIS).  Una  semana  despues 
de  la  ultima  vacuna,  cada  mono  recibio  una  inyeccion  de 
SIV  vivo.  Dos  de  los  seis  monos  vacunados  no  mostraron 
evidencia  de  infection  por  el  SIV  hasta  por  ano  y  medio 
despues  de  la  inyeccion  con  el  SIV.6  Los  cientlficos 
pudieron  aislar  el  virus  del  SIV  de  los  otros  cuatro  monos 
vacunados,  aun  cuando  estos  animales  no  mostraron 
signos  de  la  enfermedad.  (;Esta  information  contiene 
suficiente  evidencia  para  indicar  que  la  vacuna  es  eficaz 
para  proteger  al  menos  contra  el  SIV?  Use  a  =  .10. 


datos  15.71  Metal  pesado  Seefectuoun 

experimento  para  determinar  si  hay  acumulacion 


de  metales  pesados  en  plantas  crecidas  en  suelos 
mejorados  con  lodo  y  en  insectos  que  se  alimentan 
de  esas  plantas.7  Los  datos  de  la  tabla  siguiente 
son  concentraciones  de  cadmio  (en  /xg/kg),  en  plantas 
crecidas  bajo  seis  cantidades  diferentes  de  aplicacion 
de  lodo  para  tres  cosechas  distintas.  Estas  cantidades  de 
aplicacion  son  los  tratamientos.  Las  tres  cosechas 
representan  bloques  de  tiempo  en  el  diseno  de 
dos  vfas. 


Cantidad 

Cosecha 

1 

2 

3 

Control 

162.1 

153.7 

200.4 

1 

199.8 

199.6 

278.2 

2 

220.0 

210.7 

294.8 

3 

194.4 

179.0 

341.1 

4 

204.3 

203.7 

330.2 

5 

218.9 

236.1 

344.2 

a.  Con  base  en  la  grafica  de  probabilidad  normal 
MINITAB  y  la  grafica  de  residuales  contra 
cantidades,  ('esta  usted  dispuesto  a  suponer  que  las 
suposiciones  de  normalidad  y  varianza  constante 
se  satisfacen? 


Graficas  MINITAB  de  residuales  para  el  ejercicio  15.71 


Residuales  contra  cantidad 

(la  respuesta  es  cadmio) 


Grafica  de  probabilidad  normal  de  los  residuales 

(la  respuesta  es  cadmio) 
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b.  Usando  un  metodo  apropiado  de  analisis,  analice  los 
datos  para  determinar  si  hay  diferencias  significativas 
entre  las  respuestas  debidas  a  las  cantidades  de 
aplicacion. 

datos  15.72  Consulte  el  ejercicio  15.71.  Los  datos  de 
la  tabla  siguiente  son  concentraciones  de  cadmio 
encontradas  en  pulgones  alimentados  de  las  plantas 
crecidas  en  suelo  mejorado  con  lodo. 


Cantidad 

Cosecha 

1 

2 

3 

Control 

16.2 

55.8 

65.8 

1 

16.9 

119.4 

181.1 

2 

12.7 

171.9 

184.6 

3 

31.3 

128.4 

196.4 

4 

38.5 

182.0 

163.7 

5 

20.6 

191.3 

242.8 

a.  Use  la  grafica  MINITAB  de  probabilidad  normal  de  los 
residuales  y  la  grafica  de  residuales  contra  cantidades 
de  aplicacion,  para  evaluar  si  las  suposiciones  de 
normalidad  y  varianza  constante  son  razonables  en 
este  caso. 

b.  Con  base  en  las  conclusiones  del  inciso  a),  use  un 
metodo  estadfstico  apropiado  para  probar  si  hay 
diferencias  significativas  en  concentraciones  de 
cadmio  para  las  seis  cantidades  de  aplicacion. 

Graficas  MINITAB  de  residuales  para  el  ejercicio  15.71 


Residuales  contra  cantidad 

(la  respuesta  es  cadmio) 


15.73  Calificacion  de  solicitantes  de  profesor  Antes 
de  llenar  varias  nuevas  posiciones  de  profesores  en  la 
secundaria,  el  director  formo  un  consejo  de  revision 
formado  por  cinco  profesores  a  quienes  se  pidio 
entrevistaran  a  12  solicitantes  y  los  calificaran  en  orden 
de  merito.  Siete  de  los  12  solicitantes  tenfan  tftulo 
universitario  pero  tenfan  poca  experiencia  en  ensenanza. 
De  los  otros  cinco  solicitantes,  todos  tenfan  tftulo 
universitario  y  considerable  experiencia.  Las  calificaciones 
de  revision  del  consejo  se  dan  en  la  tabla  siguiente. 


Experiencia  limitada 

Experiencia  considerable 

4 

1 

6 

2 

7 

3 

9 

5 

10 

8 

11 

12 

(:,Estas  calificaciones  indican  que  el  consejo  de  revision 
considera  que  la  experiencia  es  un  factor  primordial  en  la 
seleccion  de  los  mejores  candidatos?  Pruebe  usando 
a  =  .05. 

datos  15.74  Contaminantes  en  productos 

quimicos  Un  fabricante  usa  una  gran  cantidad 
de  cierto  producto  qufmico.  Como  hay  solo  dos 
proveedores  de  este  producto  qufmico,  el  fabricante 
desea  probar  si  el  porcentaje  de  contaminantes  es  el 
mismo  para  las  dos  fuentes,  contra  la  alternativa  de  que 
hay  una  diferencia  en  los  porcentajes  de  contaminantes 
para  los  dos  proveedores.  Los  datos  de  muestras 
aleatorias  independientes  se  dan  a  continuacion: 


Proveedor 


1 

2 

.86 

.65 

.55 

.58 

.69 

1.13 

.40 

.16 

.72 

.65 

.22 

.07 

1.18 

.50 

.09 

.36 

.45 

1.04 

.16 

.20 

1.41 

.41 

.26 

.15 

a.  Use  la  prueba  de  la  suma  de  rango  de  Wilcoxon  para 
determinar  si  hay  una  diferencia  en  los  porcentajes  de 
contaminantes  para  los  dos  proveedores.  Use  a  =  .05. 

b.  Use  la  aproximacion  de  muestra  grande  a  la  prueba 
de  la  suma  de  rango  de  Wilcoxon,  para  determinar  si 
hay  diferencia  en  los  porcentajes  de  contaminantes 
para  los  dos  proveedores.  Use  a  =  .05.  Compare  sus 
conclusiones  con  las  conclusiones  del  inciso  a). 

15.75  uminacion  en  el  salon  de  clase  Se  observo 
y  midio  la  productividad  de  35  estudiantes  tanto  antes 
como  despues  de  la  instalacion  de  nuevo  alumbrado  en 
su  salon  de  clases.  Se  observo  que  habfa  mejorado  la 
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productividad  de  21  de  los  35  estudiantes,  en  tanto  que 
la  productividad  de  los  otros  no  parecio  mostrar  mejorfa 
perceptible  como  resultado  de  la  nueva  iluminacion.  Use 
la  aproximacion  a  la  prueba  del  signo  para  determinar, 
al  nivel  de  significancia  de  5%,  si  la  nueva  iluminacion 
fue  o  no  fue  eficaz  para  mejorar  la  productividad  de 
estudiantes. 

(^)datos  15.76  Reducir  el  colesterol  Se  creo  un 

medicamento  para  reducir  niveles  de  colesterol 
en  pacientes  del  sistema  cardiovascular.  Los  niveles  de 
colesterol  antes  y  despues  del  tratamiento  se  obtuvieron 
para  una  muestra  aleatoria  de  25  pacientes,  con  los 
siguientes  resultados: 


Paciente 

Antes 

Despues 

Paciente 

Antes 

Despues 

1 

257 

243 

14 

210 

217 

2 

222 

217 

15 

263 

243 

3 

177 

174 

16 

214 

198 

4 

258 

260 

17 

392 

388 

5 

294 

295 

18 

370 

357 

6 

244 

236 

19 

310 

299 

7 

390 

383 

20 

255 

258 

8 

247 

233 

21 

281 

276 

9 

409 

410 

22 

294 

295 

10 

214 

216 

23 

257 

227 

11 

217 

210 

24 

227 

231 

12 

340 

335 

25 

385 

374 

13 

364 

343 

a.  Use  la  prueba  del  signo  para  determinar  si  este 
medicamento  reduce  o  no  reduce  niveles  de  colesterol 
de  pacientes  del  corazon.  Use  a  =  .01. 

b.  Use  la  prueba  de  rango  con  signo  de  Wilcoxon 
para  probar  la  hipotesis  del  inciso  a  al  nivel  de 
significancia  de  1%.  <\Sus  conclusiones  son  iguales 
que  en  el  inciso  a)? 

datos  15.77  Legos®  El  tiempo  necesario  para  que 
ninos  de  kinder  ensamblen  un  juguete  Lego  se 
midio  para  ninos  que  habfan  recibido  ensenanza  durante 
cuatro  periodos  diferentes.  Cuatro  ninos  se  asignaron 
al  azar  a  cada  grupo  de  instructores,  pero  dos  fueron 
eliminados  durante  el  experimento  debido  a  enferme- 
dad.  En  el  experimento,  el  tiempo  (en  minutos)  para 
ensamblar  el  juguete  Lego  fue  registrado  para  cada  nino. 

Tiempo  de  ensenanza  (horas) 

.5 _ TO _ T5 _ ZO 

8  9  4  4 

14  7  6  7 

9  5  7  5 

12  8 


Use  la  prueba  H  de  Kruskal-Wallis  para  determinar  si 
hay  una  diferencia  en  la  distribucion  de  tiempos  para  los 
cuatro  tiempos  de  ensenanza  diferentes.  Use  a  =  .01. 


((J^datos  15.78  Fatiga  de  trabajadores  Para 
investigar  metodos  para  reducir  la  fatiga 
entre  empleados  cuyos  trabajos  comprenden  un 
monotono  procedimiento  de  ensamble,  a  12  empleados 
seleccionados  al  azar  se  les  pidio  realizaran  su  trabajo 
usual  bajo  cada  una  de  tres  condiciones  de  prueba.  Como 
medida  de  fatiga,  el  experimentador  uso  el  numero  de 
paradas  de  la  linea  de  ensamble  durante  un  periodo 
de  4  horas  para  cada  condicion  de  prueba. 


Empleado 

Condiciones 

1 

2 

3 

1 

31 

22 

26 

2 

20 

15 

23 

3 

26 

21 

18 

4 

31 

22 

32 

5 

12 

16 

18 

6 

22 

29 

34 

7 

28 

17 

26 

8 

15 

9 

12 

9 

41 

31 

46 

10 

19 

19 

25 

11 

31 

34 

41 

12 

18 

11 

21 

a.  <^Que  tipo  de  diseno  experimental  se  ha  empleado  en 
este  experimento? 

b.  Use  la  prueba  no  parametrica  apropiada  para 
determinar  si  la  distribucion  de  paradas  de  la  lmea  de 
ensamble  (y,  en  consecuencia,  fatiga  del  trabajador) 
difiere  para  estas  tres  condiciones.  Pruebe  al  nivel  de 
significancia  de  5%. 

15.79  Clasificacion  de  mariscales  de  campo 

Se  hizo  una  clasificacion  de  mariscales  de  campo,  de  los 
ocho  mejores  equipos  de  la  National  Football  League, 
al  encuestar  varios  periodistas  de  deportes  y  coaches 
profesionales.  Esta  “clasificacion  verdadera”  se  muestra 
a  continuation,  junto  con  “mi  clasificacion”. 


Mariscal  de 

campo 

A 

B 

C 

D 

E 

F 

G 

H 

Clasificacion 

verdadera 

1 

2 

3 

4 

5 

6 

7 

8 

Mi  clasificacion 

3 

1 

4 

5 

2 

8 

6 

7 

a.  Calcule  rs. 

b.  7,  Los  datos  indican  una  correlation  positiva  entre  mi 
clasificacion  y  la  de  los  expertos?  Pruebe  al  nivel  de 
significancia  de  5%. 
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CASO 

prActico 

(C^  DATOS  Huevos 


(Como  esta  su  nivel  de  colesterol? 


A  medida  que  los  consumidores  se  han  interesado  cada  vez  mas  en  tomar  alimentos  salu- 
dables,  muchos  productos  “light”,  “sin  grasa”  y  “sin  colesterol”  estan  apareciendo  en  el 
supermercado.  Uno  de  esos  productos  es  el  sustituto  de  huevos  congelados,  producto  sin 
colesterol  que  se  puede  usar  al  cocinar  y  hornear  en  muchas  de  las  mismas  formas  que  un 
hue vo  comun  y  corriente,  aunque  no  todas.  Algunos  consumidores  hasta  usan  sustitutos 
de  huevo,  para  elaborar  un  aderezo  de  ensalada  Cesar  y  otras  recetas  que  piden  huevos  cru- 
dos  porque  estos  productos  estan  pasteurizados  y  asf  eliminan  problemas  por  contamina- 
cion  por  bacterias. 

Desafortunadamente,  los  productos  actualmente  en  el  mercado  exhiben  fuertes  dife- 
rencias  en  sabor  y  textura  cuando  se  prueban  en  su  preparation  como  huevos  revueltos. 
A  cinco  miembros  de  un  grupo  de  discusion,  todos  ellos  expertos  en  nutrition  y  prepa¬ 
racion  de  alimentos,  se  les  pidio  que  calificaran  cada  uno  de  tres  sustitutos  de  huevo  con 
base  en  sabor,  apariencia,  textura  y  si  ellos  comprarfan  el  producto.8  Los  jueces  probaron 
los  tres  sustitutos  de  huevo  y  los  calificaron  en  una  escala  de  0  a  20.  Los  resultados,  que 
se  ven  en  la  tabla  siguiente,  indican  que  la  calificacion  mas  alta,  por  23  puntos,  fue  para 
el  producto  llamado  Healthy  Choice  Egg  (Huevo  Selecto  Saludable)  de  ConAgra,  que  los 
probadores  unanimemente  acordaron  como  los  que  mas  se  asemejan  a  los  que  produce 
una  gallina.  El  producto  que  quedo  en  segundo  lugar,  Morningstar  Farms’  Scramblers, 
impresiono  a  varios  de  los  probadores  por  su  “sabor  singularmente  dulce  .  .  .  semejante  a 
zanahoria”.  Por  ultimo,  ninguno  de  los  probadores  indico  que  estarfan  dispuestos  a  com- 
prar  el  de  Egg  Beaters  de  Fleishmann,  que  fue  descrito  por  los  expertos  como  “aguado”, 
“resbaloso”  y  “desagradable”.  Por  extrano  que  parezca,  estos  resultados  son  contrarios  a 
una  prueba  similar  de  sabor  realizada  4  anos  antes,  en  donde  Egg  Beaters  fue  considerada 
mejor  que  los  sustitutos  de  huevo  de  la  competencia. 


Probador 

Healthy  Choice 

Scramblers 

Egg  Beaters 

Dan  Bowe 

16 

9 

7 

John  Carroll 

16 

7 

8 

Donna  Katzl 

14 

8 

4 

Rick  O'Connell 

15 

16 

9 

Roland  Passot 

13 

11 

2 

Totales 

74 

51 

30 

Fuente:  Datos  de  "Egg  Substitutes  Range  in  Quality",  por  K.  Sakekel,  The  San  Francisco  Chronicle, 
10  de  febrero,  1993,  p.  8.  Copyright©  1993  San  Francisco  Chronicle. 


1 .  ('.Que  tipo  de  diseno  se  ha  empleado  en  este  experimento  de  prueba  de  sabor? 

2.  7,  Los  datos  satisfacen  las  suposiciones  requeridas  para  un  analisis  parametrico  de  va- 
rianza? 

3.  Use  la  tecnica  no  parametrica  apropiada  para  determinar  si  hay  una  diferencia  signifi- 
cativa  entre  el  promedio  de  calificaciones  para  las  tres  marcas  de  sustitutos  de  huevo. 
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tabla  1  Probabilidades  binomiales  acumulativas 

Los  valores  tabulados  son  P(x  <  k)  =  p( 0)  +  p(  1)  +  •  ■  •  +  p(fc). 
(Los  calculos  estan  redondeados  al  tercer  lugar  decimal.) 


n 


=  2 


P 


A- 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.980 

.902 

.810 

.640 

.490 

.360 

.250 

.160 

.090 

.040 

.010 

.002 

.000 

0 

1 

1.000 

.998 

.990 

.960 

.910 

.840 

.750 

.640 

.510 

.360 

.190 

.098 

.020 

1 

2 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

2 

n  = 

3 

P 

k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.970 

.857 

.729 

.512 

.343 

.216 

.125 

.064 

.027 

.008 

.001 

.000 

.000 

0 

1 

1.000 

.993 

.972 

.896 

.784 

.648 

.500 

.352 

.216 

.104 

.028 

.007 

.000 

1 

2 

1.000 

1.000 

.999 

.992 

.973 

.936 

.875 

.784 

.657 

.488 

.271 

.143 

.030 

2 

3 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

3 

n 


=  4 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.961 

.815 

.656 

.410 

.240 

.130 

.062 

.026 

.008 

.002 

.000 

.000 

.000 

0 

1 

.999 

.986 

.948 

.819 

.652 

.475 

.312 

.179 

.084 

.027 

.004 

.000 

.000 

1 

2 

1.000 

1.000 

.996 

.973 

.916 

.821 

.688 

.525 

.348 

.181 

.052 

.014 

.001 

2 

3 

1.000 

1.000 

1.000 

.998 

.992 

.974 

.938 

.870 

.760 

.590 

.344 

.185 

.039 

3 

4 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

4 
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n  = 


5 


P 


A- 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.951 

.774 

.590 

.328 

.168 

.078 

.031 

.010 

.002 

.000 

.000 

.000 

.000 

0 

1 

.999 

.977 

.919 

.737 

.528 

.337 

.188 

.087 

.031 

.007 

.000 

.000 

.000 

1 

2 

1.000 

.999 

.991 

.942 

.837 

.683 

.500 

.317 

.163 

.058 

.009 

.001 

.000 

2 

3 

1.000 

1.000 

1.000 

.993 

.969 

.913 

.812 

.663 

.472 

.263 

.081 

.023 

.001 

3 

4 

1.000 

1.000 

1.000 

1.000 

.998 

.990 

.969 

.922 

.832 

.672 

.410 

.226 

.049 

4 

5 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

5 

n  = 


6 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.941 

.735 

.531 

.262 

.118 

.047 

.016 

.004 

.001 

.000 

.000 

.000 

.000 

0 

1 

.999 

.967 

.886 

.655 

.420 

.233 

.109 

.041 

.011 

.002 

.000 

.000 

.000 

1 

2 

1.000 

.998 

.984 

.901 

.744 

.544 

.344 

.179 

.070 

.017 

.001 

.000 

.000 

2 

3 

1.000 

1.000 

.999 

.983 

.930 

.821 

.656 

.456 

.256 

.099 

.016 

.002 

.000 

3 

4 

1.000 

1.000 

1.000 

.998 

.989 

.959 

.891 

.767 

.580 

.345 

.114 

.033 

.001 

4 

5 

1.000 

1.000 

1.000 

1.000 

.999 

.996 

.984 

.953 

.882 

.738 

.469 

.265 

.059 

5 

6 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

6 

n  = 


7 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.932 

.698 

.478 

.210 

.082 

.028 

.008 

.002 

.000 

.000 

.000 

.000 

.000 

0 

1 

.998 

.956 

.850 

.577 

.329 

.159 

.062 

.019 

.004 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.996 

.974 

.852 

.647 

.420 

.227 

.096 

.029 

.005 

.000 

.000 

.000 

2 

3 

1.000 

1.000 

.997 

.967 

.874 

.710 

.500 

.290 

.126 

.033 

.003 

.000 

.000 

3 

4 

1.000 

1.000 

1.000 

.995 

.971 

.904 

.773 

.580 

.353 

.148 

.026 

.004 

.000 

4 

5 

1.000 

1.000 

1.000 

1.000 

.996 

.981 

.938 

.841 

.671 

.423 

.150 

.044 

.002 

5 

6 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.992 

.972 

.918 

.790 

.522 

.302 

.068 

6 

7 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

7 

n  =  8 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.923 

.663 

.430 

.168 

.058 

.017 

.004 

.001 

.000 

.000 

.000 

.000 

.000 

0 

1 

.997 

.943 

.813 

.503 

.255 

.106 

.035 

.009 

.001 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.994 

.962 

.797 

.552 

.315 

.145 

.050 

.011 

.001 

.000 

.000 

.000 

2 

3 

1.000 

1.000 

.995 

.944 

.806 

.594 

.363 

.174 

.058 

.010 

.000 

.000 

.000 

3 

4 

1.000 

1.000 

1.000 

.990 

.942 

.826 

.637 

.406 

.194 

.056 

.005 

.000 

.000 

4 

5 

1.000 

1.000 

1.000 

.999 

.989 

.950 

.855 

.685 

.448 

.203 

.038 

.006 

.000 

5 

6 

1.000 

1.000 

1.000 

1.000 

.999 

.991 

.965 

.894 

.745 

.497 

.187 

.057 

.003 

6 

7 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.996 

.983 

.942 

.832 

.570 

.337 

.077 

7 

8 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

8 
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TABLA  1  (continuacion) 


n  =  9 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.914 

.630 

.387 

.134 

.040 

.010 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.997 

.929 

.775 

.436 

.196 

.071 

.020 

.004 

.000 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.992 

.947 

.738 

.463 

.232 

.090 

.025 

.004 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.999 

.992 

.914 

.730 

.483 

.254 

.099 

.025 

.003 

.000 

.000 

.000 

3 

4 

1.000 

1.000 

.999 

.980 

.901 

.733 

.500 

.267 

.099 

.020 

.001 

.000 

.000 

4 

5 

1.000 

1.000 

1.000 

.997 

.975 

.901 

.746 

.517 

.270 

.086 

.008 

.001 

.000 

5 

6 

1.000 

1.000 

1.000 

1.000 

.996 

.975 

.910 

.768 

.537 

.262 

.053 

.008 

.000 

6 

7 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.980 

.929 

.804 

.564 

.225 

.071 

.003 

7 

8 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.990 

.960 

.866 

.613 

.370 

.086 

8 

9 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

9 

n  = 

10 

P 

k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.904 

.599 

.349 

.107 

.028 

.006 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.996 

.914 

.736 

.376 

.149 

.046 

.01 1 

.002 

.000 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.988 

.930 

.678 

.383 

.167 

.055 

.012 

.002 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.999 

.987 

.879 

.650 

.382 

.172 

.055 

.01 1 

.001 

.000 

.000 

.000 

3 

4 

1.000 

1.000 

.998 

.967 

.850 

.633 

.377 

.166 

.047 

.006 

.000 

.000 

.000 

4 

5 

1.000 

1.000 

1.000 

.994 

.953 

.834 

.623 

.367 

.150 

.033 

.002 

.000 

.000 

5 

6 

1.000 

1.000 

1.000 

.999 

.989 

.945 

.828 

.618 

.350 

.121 

.013 

.001 

.000 

6 

7 

1.000 

1.000 

1.000 

1.000 

.998 

.988 

.945 

.833 

.617 

.322 

.070 

.012 

.000 

7 

8 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.989 

.954 

.851 

.624 

.264 

.086 

.004 

8 

9 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.994 

.972 

.893 

.651 

.401 

.096 

9 

10 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

10 

n  = 

11 

P 

k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.895 

.569 

.314 

.086 

.020 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.995 

.898 

.697 

.322 

.113 

.030 

.006 

.001 

.000 

.000 

.000 

.000 

.000 

1 

2 

1.000 

.985 

.910 

.617 

.313 

.119 

.033 

.006 

.001 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.998 

.981 

.839 

.570 

.296 

.113 

.029 

.004 

.000 

.000 

.000 

.000 

3 

4 

1.000 

1.000 

.997 

.950 

.790 

.533 

.274 

.099 

.022 

.002 

.000 

.000 

.000 

4 

5 

1.000 

1.000 

1.000 

.988 

.922 

.754 

.500 

.246 

.078 

.012 

.000 

.000 

.000 

5 

6 

1.000 

1.000 

1.000 

.998 

.978 

.901 

.726 

.467 

.210 

.050 

.003 

.000 

.000 

6 

7 

1.000 

1.000 

1.000 

1.000 

.996 

.971 

.887 

.704 

.430 

.161 

.019 

.002 

.000 

7 

8 

1.000 

1.000 

1.000 

1.000 

.999 

.994 

.967 

.881 

.687 

.383 

.090 

.015 

.000 

8 

9 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.994 

.970 

.887 

.678 

.303 

.102 

.005 

9 

10 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.980 

.914 

.686 

.431 

.105 

10 

11 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

11 
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APENDICE I  TABLAS  O  683 


TABLA  1  (continuacion) 


n=  12 


k 

P 

k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

0 

.886 

.540 

.282 

.069 

.014 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.994 

.882 

.659 

.275 

.085 

.020 

.003 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2  1 

.000 

.980 

.889 

.558 

.253 

.083 

.019 

.003 

.000 

.000 

.000 

.000 

.000 

2 

3  1 

.000 

.998 

.974 

.795 

.493 

.225 

.073 

.015 

.002 

.000 

.000 

.000 

.000 

3 

4  1 

.000 

1.000 

.996 

.927 

.724 

.438 

.194 

.057 

.009 

.001 

.000 

.000 

.000 

4 

5  1 

.000 

1.000 

.999 

.981 

.882 

.665 

.387 

.158 

.039 

.004 

.000 

.000 

.000 

5 

6  1 

.000 

1.000 

1.000 

.996 

.961 

.842 

.613 

.335 

.118 

.019 

.001 

.000 

.000 

6 

7  1 

.000 

1.000 

1.000 

.999 

.991 

.943 

.806 

.562 

.276 

.073 

.004 

.000 

.000 

7 

8  1 

.000 

1.000 

1.000 

1.000 

.998 

.985 

.927 

.775 

.507 

.205 

.026 

.002 

.000 

8 

9  1 

.000 

1.000 

1.000 

1.000 

1.000 

.997 

.981 

.917 

.747 

.442 

.111 

.020 

.000 

9 

10  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.997 

.980 

.915 

.725 

.341 

.118 

.006 

10 

1 1  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.986 

.931 

.718 

.460 

.1 14 

11 

12  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

12 

n  =  15 

P 

k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.860 

.463 

.206 

.035 

.005 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.990 

.829 

.549 

.167 

.035 

.005 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2  1 

.000 

.964 

.816 

.398 

.127 

.027 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

2 

3  1 

.000 

.995 

.944 

.648 

.297 

.091 

.018 

.002 

.000 

.000 

.000 

.000 

.000 

3 

4  1 

.000 

.999 

.987 

.836 

.515 

.217 

.059 

.009 

.001 

.000 

.000 

.000 

.000 

4 

5  1 

.000 

1.000 

.998 

.939 

.722 

.403 

.151 

.034 

.004 

.000 

.000 

.000 

.000 

5 

6  1 

.000 

1.000 

1.000 

.982 

.869 

.610 

.304 

.095 

.015 

.001 

.000 

.000 

.000 

6 

7  1 

.000 

1.000 

1.000 

.996 

.950 

.787 

.500 

.213 

.050 

.004 

.000 

.000 

.000 

7 

8  1 

.000 

1.000 

1.000 

.999 

.985 

.905 

.696 

.390 

.131 

.018 

.000 

.000 

.000 

8 

9  1 

.000 

1.000 

1.000 

1.000 

.996 

.966 

.849 

.597 

.278 

.061 

.002 

.000 

.000 

9 

10  1 

.000 

1.000 

1.000 

1.000 

.999 

.991 

.941 

.783 

.485 

.164 

.013 

.001 

.000 

10 

11  1 

.000 

1.000 

1.000 

1.000 

1.000 

.998 

.982 

.909 

.703 

.352 

.056 

.005 

.000 

11 

12  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.973 

.873 

.602 

.184 

.036 

.000 

12 

13  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.995 

.965 

.833 

.451 

.171 

.010 

13 

14  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.995 

.965 

.794 

.537 

.140 

14 

15  1 

.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

15 
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TABLA  1  (continuacion) 


n  =  20 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.818 

.358 

.122 

.012 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.983 

.736 

.392 

.069 

.008 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2 

.999 

.925 

.677 

.206 

.035 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.984 

.867 

.41 1 

.107 

.016 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

3 

4 

1.000 

.997 

.957 

.630 

.238 

.051 

.006 

.000 

.000 

.000 

.000 

.000 

.000 

4 

5 

1.000 

1.000 

.989 

.804 

.416 

.126 

.021 

.002 

.000 

.000 

.000 

.000 

.000 

5 

6 

1.000 

1.000 

.998 

.913 

.608 

.250 

.058 

.006 

.000 

.000 

.000 

.000 

.000 

6 

7 

1.000 

1.000 

1.000 

.968 

.772 

.416 

.132 

.021 

.001 

.000 

.000 

.000 

.000 

7 

8 

1.000 

1.000 

1.000 

.990 

.887 

.596 

.252 

.057 

.005 

.000 

.000 

.000 

.000 

8 

9 

1.000 

1.000 

1.000 

.997 

.952 

.755 

.412 

.128 

.017 

.001 

.000 

.000 

.000 

9 

10 

1.000 

1.000 

1.000 

.999 

.983 

.872 

.588 

.245 

.048 

.003 

.000 

.000 

.000 

10 

1 1 

1.000 

1.000 

1.000 

1.000 

.995 

.943 

.748 

.404 

.113 

.010 

.000 

.000 

.000 

11 

12 

1.000 

1.000 

1.000 

1.000 

.999 

.979 

.868 

.584 

.228 

.032 

.000 

.000 

.000 

12 

13 

1.000 

1.000 

1.000 

1.000 

1.000 

.994 

.942 

.750 

.392 

.087 

.002 

.000 

.000 

13 

14 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.979 

.874 

.584 

.196 

.011 

.000 

.000 

14 

IS 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.994 

.949 

.762 

.370 

.043 

.003 

.000 

15 

16 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.984 

.893 

.589 

.133 

.016 

.000 

16 

17 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.965 

.794 

.323 

.075 

.001 

17 

18 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.992 

.931 

.608 

.264 

.017 

18 

19 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.988 

.878 

.642 

.182 

19 

20 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

20 
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APENDICE I  TABLAS  O  685 


TABLA  1  (continuacion) 


n  =  25 


P 


k 

.01 

.05 

.10 

.20 

.30 

.40 

.50 

.60 

.70 

.80 

.90 

.95 

.99 

k 

0 

.778 

.277 

.072 

.004 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

0 

1 

.974 

.642 

.271 

.027 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

2 

.998 

.873 

.537 

.098 

.009 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

2 

3 

1.000 

.966 

.764 

.234 

.033 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

3 

4 

1.000 

.993 

.902 

.421 

.090 

.009 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

4 

5 

1.000 

.999 

.967 

.617 

.193 

.029 

.002 

.000 

.000 

.000 

.000 

.000 

.000 

5 

6 

1.000 

1.000 

.991 

.780 

.341 

.074 

.007 

.000 

.000 

.000 

.000 

.000 

.000 

6 

7 

1.000 

1.000 

.998 

.891 

.512 

.154 

.022 

.001 

.000 

.000 

.000 

.000 

.000 

7 

8 

1.000 

1.000 

1.000 

.953 

.677 

.274 

.054 

.004 

.000 

.000 

.000 

.000 

.000 

8 

9 

1.000 

1.000 

1.000 

.983 

.811 

.425 

.115 

.013 

.000 

.000 

.000 

.000 

.000 

9 

10 

1.000 

1.000 

1.000 

.994 

.902 

.586 

.212 

.034 

.002 

.000 

.000 

.000 

.000 

10 

1 1 

1.000 

1.000 

1.000 

.998 

.956 

.732 

.345 

.078 

.006 

.000 

.000 

.000 

.000 

11 

12 

1.000 

1.000 

1.000 

1.000 

.983 

.846 

.500 

.154 

.017 

.000 

.000 

.000 

.000 

12 

13 

1.000 

1.000 

1.000 

1.000 

.994 

.922 

.655 

.268 

.044 

.002 

.000 

.000 

.000 

13 

14 

1.000 

1.000 

1.000 

1.000 

.998 

.966 

.788 

.414 

.098 

.006 

.000 

.000 

.000 

14 

15 

1.000 

1.000 

1.000 

1.000 

1.000 

.987 

.885 

.575 

.189 

.017 

.000 

.000 

.000 

15 

16 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.946 

.726 

.323 

.047 

.000 

.000 

.000 

16 

17 

1.000 

1.000 

1.000 

1.000 

1.000 

.999 

.978 

.846 

.488 

.109 

.002 

.000 

.000 

17 

18 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.993 

.926 

.659 

.220 

.009 

.000 

.000 

18 

19 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.971 

.807 

.383 

.033 

.001 

.000 

19 

20 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.991 

.910 

.579 

.098 

.007 

.000 

20 

21 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.967 

.766 

.236 

.034 

.000 

21 

22 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.991 

.902 

.463 

.127 

.002 

22 

23 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.998 

.973 

.729 

.358 

.026 

23 

24 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

.996 

.928 

.723 

.222 

24 

25 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

1.000 

25 
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686  O  APENDICE I  TABLAS 


tabla  2  Probabilidades  acumulativas  de  Poisson 

Los  valores  tabulados  son  P(x  <  k)  =  p( 0)  +  p(1)  +  ■  ■  ■  +  p(k). 
(Los  calculos  estan  redondeados  al  tercer  lugar  decimal.) 


p 


k 

.1 

.2 

.3 

.4 

.5 

.6 

.7 

.8 

.9 

1.0 

1.5 

0 

.905 

.819 

.741 

.670 

.607 

.549 

.497 

.449 

.407 

.368 

.223 

1 

.995 

.982 

.963 

.938 

.910 

.878 

.844 

.809 

.772 

.736 

.558 

2 

1.000 

.999 

.996 

.992 

.986 

.977 

.966 

.953 

.937 

.920 

.809 

3 

1.000 

1.000 

.999 

.998 

.997 

.994 

.991 

.987 

.981 

.934 

4 

1.000 

1.000 

1.000 

.999 

.999 

.998 

.996 

.981 

5 

1.000 

1.000 

1.000 

.999 

.996 

6 

1.000 

.999 

7 

1.000 

p 


k 

2.0 

2.5 

3.0 

3.5 

4.0 

4.5 

5.0 

5.5 

6.0 

6.5 

7.0 

0 

.135 

.082 

.055 

.033 

.018 

.011 

.007 

.004 

.003 

.002 

.001 

1 

.406 

.287 

.199 

.136 

.092 

.061 

.040 

.027 

.017 

.011 

.007 

2 

.677 

.544 

.423 

.321 

.238 

.174 

.125 

.088 

.062 

.043 

.030 

3 

.857 

.758 

.647 

.537 

.433 

.342 

.265 

.202 

.151 

.112 

.082 

4 

.947 

.891 

.815 

.725 

.629 

.532 

.440 

.358 

.285 

.224 

.173 

5 

.983 

.958 

.916 

.858 

.785 

.703 

.616 

.529 

.446 

.369 

.301 

6 

.995 

.986 

.966 

.935 

.889 

.831 

.762 

.686 

.606 

.563 

.450 

7 

.999 

.996 

.988 

.973 

.949 

.913 

.867 

.809 

.744 

.673 

.599 

8 

1.000 

.999 

.996 

.990 

.979 

.960 

.932 

.894 

.847 

.792 

.729 

9 

1.000 

.999 

.997 

.992 

.983 

.968 

.946 

.916 

.877 

.830 

10 

1.000 

.999 

.997 

.993 

.986 

.975 

.957 

.933 

.901 

1 1 

1.000 

.999 

.998 

.995 

.989 

.980 

.966 

.947 

12 

1.000 

.999 

.998 

.996 

.991 

.984 

.973 

13 

1.000 

.999 

.998 

.996 

.993 

.987 

14 

1.000 

.999 

.999 

.997 

.994 

15 

1.000 

.999 

.999 

.998 

16 

1.000 

1.000 

.999 

17 

1.000 
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TABLA  2  (continuacion) 


k 

7.5 

8.0 

8.5 

9.0 

9.5 

10.0 

12.0 

15.0 

20.0 

0 

.001 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

.000 

1 

.005 

.003 

.002 

.001 

.001 

.000 

.000 

.000 

.000 

2 

.020 

.014 

.009 

.006 

.004 

.003 

.001 

.000 

.000 

3 

.059 

.042 

.030 

.021 

.015 

.010 

.002 

.000 

.000 

4 

.132 

.100 

.074 

.055 

.040 

.029 

.008 

.001 

.000 

5 

.241 

.191 

.150 

.116 

.089 

.067 

.020 

.003 

.000 

6 

.378 

.313 

.256 

.207 

.165 

.130 

.046 

.008 

.000 

7 

.525 

.453 

.386 

.324 

.269 

.220 

.090 

.018 

.001 

8 

.662 

.593 

.523 

.456 

.392 

.333 

.155 

.037 

.002 

9 

.776 

.717 

.653 

.587 

.522 

.458 

.242 

.070 

.005 

10 

.862 

.816 

.763 

.706 

.645 

.583 

.347 

.118 

.011 

1 1 

.921 

.888 

.849 

.803 

.752 

.697 

.462 

.185 

.021 

12 

.957 

.936 

.909 

.876 

.836 

.792 

.576 

.268 

.039 

13 

.978 

.966 

.949 

.926 

.898 

.864 

.682 

.363 

.066 

14 

.990 

.983 

.973 

.959 

.940 

.917 

.772 

.466 

.105 

15 

.995 

.992 

.986 

.978 

.967 

.951 

.844 

.568 

.157 

16 

.998 

.996 

.993 

.989 

.982 

.973 

.899 

.664 

.221 

17 

.999 

.998 

.997 

.995 

.991 

.986 

.937 

.749 

.297 

18 

1.000 

.999 

.999 

.998 

.996 

.993 

.963 

.819 

.381 

19 

1.000 

.999 

.999 

.998 

.997 

.979 

.875 

.470 

20 

1.000 

1.000 

.999 

.998 

.988 

.917 

.559 

21 

1.000 

.999 

.994 

.947 

.644 

22 

1.000 

.997 

.967 

.721 

23 

.999 

.981 

.787 

24 

.999 

.989 

.843 

25 

1.000 

.994 

.888 

26 

.997 

.922 

27 

.998 

.948 

28 

.999 

.966 

29 

1.000 

.978 

30 

.987 

31 

.992 

32 

.995 

33 

.997 

34 

.999 

35 

.999 

36 

1.000 
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tabla  3  Areas  bajo  la  curva  normal 


z 

.00 

.01 

.02 

.03 

.04 

.05 

.06 

.07 

.08 

.09 

-3.4 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0002 

-3.3 

.0005 

.0005 

.0005 

.0004 

.0004 

.0004 

.0004 

.0004 

.0004 

.0003 

-3.2 

.0007 

.0007 

.0006 

.0006 

.0006 

.0006 

.0006 

.0005 

.0005 

.0005 

-3.1 

.0010 

.0009 

.0009 

.0009 

.0008 

.0008 

.0008 

.0008 

.0007 

.0007 

-3.0 

.0013 

.0013 

.0013 

.0012 

.0012 

.0011 

.0011 

.0011 

.0010 

.0010 

-2.9 

.0019 

.0018 

.0017 

.0017 

.0016 

.0016 

.0015 

.0015 

.0014 

.0014 

-2.8 

.0026 

.0025 

.0024 

.0023 

.0023 

.0022 

.0021 

.0021 

.0020 

.0019 

-2.7 

.0035 

.0034 

.0033 

.0032 

.0031 

.0030 

.0029 

.0028 

.0027 

.0026 

-2.6 

.0047 

.0045 

.0044 

.0043 

.0041 

.0040 

.0039 

.0038 

.0037 

.0036 

-2.5 

.0062 

.0060 

.0059 

.0057 

.0055 

.0054 

.0052 

.0051 

.0049 

.0048 

-2.4 

.0082 

.0080 

.0078 

.0075 

.0073 

.0071 

.0069 

.0068 

.0066 

.0064 

-2.3 

.0107 

.0104 

.0102 

.0099 

.0096 

.0094 

.0091 

.0089 

.0087 

.0084 

-2.2 

.0139 

.0136 

.0132 

.0129 

.0125 

.0122 

.0119 

.0116 

.0113 

.0110 

-2.1 

.0179 

.0174 

.0170 

.0166 

.0162 

.0158 

.0154 

.0150 

.0146 

.0143 

-2.0 

.0228 

.0222 

.0217 

.0212 

.0207 

.0202 

.0197 

.0192 

.0188 

.0183 

-1.9 

.0287 

.0281 

.0274 

.0268 

.0262 

.0256 

.0250 

.0244 

.0239 

.0233 

-1.8 

.0359 

.0351 

.0344 

.0336 

.0329 

.0322 

.0314 

.0307 

.0301 

.0294 

-1.7 

.0446 

.0436 

.0427 

.0418 

.0409 

.0401 

.0392 

.0384 

.0375 

.0367 

-1.6 

.0548 

.0537 

.0526 

.0516 

.0505 

.0495 

.0485 

.0475 

.0465 

.0455 

-1.5 

.0668 

.0655 

.0643 

.0630 

.0618 

.0606 

.0594 

.0582 

.0571 

.0559 

-1.4 

.0808 

.0793 

.0778 

.0764 

.0749 

.0735 

.0722 

.0708 

.0694 

.0681 

-1.3 

.0968 

.0951 

.0934 

.0918 

.0901 

.0885 

.0869 

.0853 

.0838 

.0823 

-1.2 

.1151 

.1131 

.1112 

.1093 

.1075 

.1056 

.1038 

.1020 

.1003 

.0985 

-1.1 

.1357 

.1335 

.1314 

.1292 

.1271 

.1251 

.1230 

.1210 

.1190 

.1170 

-1.0 

.1587 

.1562 

.1539 

.1515 

.1492 

.1469 

.1446 

.1423 

.1401 

.1379 

-0.9 

.1841 

.1814 

.1788 

.1762 

.1736 

.1711 

.1685 

.1660 

.1635 

.1611 

-0.8 

.2119 

.2090 

.2061 

.2033 

.2005 

.1977 

.1949 

.1922 

.1894 

.1867 

-0.7 

.2420 

.2389 

.2358 

.2327 

.2296 

.2266 

.2236 

.2206 

.2177 

.2148 

-0.6 

.2743 

.2709 

.2676 

.2643 

.2611 

.2578 

.2546 

.2514 

.2483 

.2451 

-0.5 

.3085 

.3050 

.3015 

.2981 

.2946 

.2912 

.2877 

.2843 

.2810 

.2776 

-0.4 

.3446 

.3409 

.3372 

.3336 

.3300 

.3264 

.3228 

.3192 

.3156 

.3121 

-0.3 

.3821 

.3783 

.3745 

.3707 

.3669 

.3632 

.3594 

.3557 

.3520 

.3483 

-0.2 

.4207 

.4168 

.4129 

.4090 

.4052 

.4013 

.3974 

.3936 

.3897 

.3859 

-0.1 

.4602 

.4562 

.4522 

.4483 

.4443 

.4404 

.4364 

.4325 

.4286 

.4247 

-0.0 

.5000 

.4960 

.4920 

.4880 

.4840 

.4801 

.4761 

.4721 

.4681 

.4641 
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TABLA  3  (continuacion) 


z 

.00 

.01 

.02 

.03 

.04 

.05 

.06 

.07 

.08 

.09 

0.0 

.5000 

.5040 

.5080 

.5120 

.5160 

.5199 

.5239 

.5279 

.5319 

.5359 

0.1 

.5398 

.5438 

.5478 

.5517 

.5557 

.5596 

.5636 

.5675 

.5714 

.5753 

0.2 

.5793 

.5832 

.5871 

.5910 

.5948 

.5987 

.6026 

.6064 

.6103 

.6141 

0.3 

.6179 

.6217 

.6255 

.6293 

.6331 

.6368 

.6406 

.6443 

.6480 

.6517 

0.4 

.6554 

.6591 

.6628 

.6664 

.6700 

.6736 

.6772 

.6808 

.6844 

.6879 

0.5 

.6915 

.6950 

.6985 

.7019 

.7054 

.7088 

.7123 

.7157 

.7190 

.7224 

0.6 

.7257 

.7291 

.7324 

.7357 

.7389 

.7422 

.7454 

.7486 

.7517 

.7549 

0.7 

.7580 

.761 1 

.7642 

.7673 

.7704 

.7734 

.7764 

.7794 

.7823 

.7852 

0.8 

.7881 

.7910 

.7939 

.7967 

.7995 

.8023 

.8051 

.8078 

.8106 

.8133 

0.9 

.8159 

.8186 

.8212 

.8238 

.8264 

.8289 

.8315 

.8340 

.8365 

.8389 

1.0 

.8413 

.8438 

.8461 

.8485 

.8508 

.8531 

.8554 

.8577 

.8599 

.8621 

1.1 

.8643 

.8665 

.8686 

.8708 

.8729 

.8749 

.8770 

.8790 

.8810 

.8830 

1.2 

.8849 

.8869 

.8888 

.8907 

.8925 

.8944 

.8962 

.8980 

.8997 

.9015 

1.3 

.9032 

.9049 

.9066 

.9082 

.9099 

.9115 

.9131 

.9147 

.9162 

.9177 

1.4 

.9192 

.9207 

.9222 

.9236 

.9251 

.9265 

.9279 

.9292 

.9306 

.9319 

1.5 

.9332 

.9345 

.9357 

.9370 

.9382 

.9394 

.9406 

.9418 

.9429 

.9441 

1.6 

.9452 

.9463 

.9474 

.9484 

.9495 

.9505 

.9515 

.9525 

.9535 

.9545 

1.7 

.9554 

.9564 

.9573 

.9582 

.9591 

.9599 

.9608 

.9616 

.9625 

.9633 

1.8 

.9641 

.9649 

.9656 

.9664 

.9671 

.9678 

.9686 

.9693 

.9699 

.9706 

1.9 

.9713 

.9719 

.9726 

.9732 

.9738 

.9744 

.9750 

.9756 

.9761 

.9767 

2.0 

.9772 

.9778 

.9783 

.9788 

.9793 

.9798 

.9803 

.9808 

.9812 

.9817 

2.1 

.9821 

.9826 

.9830 

.9834 

.9838 

.9842 

.9846 

.9850 

.9854 

.9857 

2.2 

.9861 

.9864 

.9868 

.9871 

.9875 

.9878 

.9881 

.9884 

.9887 

.9890 

2.3 

.9893 

.9896 

.9898 

.9901 

.9904 

.9906 

.9909 

.9911 

.9913 

.9916 

2.4 

.9918 

.9920 

.9922 

.9925 

.9927 

.9929 

.9931 

.9932 

.9934 

.9936 

2.5 

.9938 

.9940 

.9941 

.9943 

.9945 

.9946 

.9948 

.9949 

.9951 

.9952 

2.6 

.9953 

.9955 

.9956 

.9957 

.9959 

.9960 

.9961 

.9962 

.9963 

.9964 

2.7 

.9965 

.9966 

.9967 

.9968 

.9969 

.9970 

.9971 

.9972 

.9973 

.9974 

2.8 

.9974 

.9975 

.9976 

.9977 

.9977 

.9978 

.9979 

.9979 

.9980 

.9981 

2.9 

.9981 

.9982 

.9982 

.9983 

.9984 

.9984 

.9985 

.9985 

.9986 

.9986 

3.0 

.9987 

.9987 

.9987 

.9988 

.9988 

.9989 

.9989 

.9989 

.9990 

.9990 

3.1 

.9990 

.9991 

.9991 

.9991 

.9992 

.9992 

.9992 

.9992 

.9993 

.9993 

3.2 

.9993 

.9993 

.9994 

.9994 

.9994 

.9994 

.9994 

.9995 

.9995 

.9995 

3.3 

.9995 

.9995 

.9995 

.9996 

.9996 

.9996 

.9996 

.9996 

.9996 

.9997 

3.4 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9998 
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TABLA  4 

Valores  crfticos 
de  f 


df 

£.100 

£.050 

£.025 

£.010 

£.005 

df 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

1 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

2 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

3 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

4 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

5 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

6 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

7 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

8 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

9 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

10 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

11 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

12 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

13 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

14 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

15 

16 

1.337 

1.746 

2.120 

2.583 

2.921 

16 

17 

1.333 

1.740 

2.110 

2.567 

2.898 

17 

18 

1.330 

1.734 

2.101 

2.552 

2.878 

18 

19 

1.328 

1.729 

2.093 

2.539 

2.861 

19 

20 

1.325 

1.725 

2.086 

2.528 

2.845 

20 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

21 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

22 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

23 

24 

1.318 

1.71 1 

2.064 

2.492 

2.797 

24 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

25 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

26 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

27 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

28 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

29 

00 

1.282 

1.645 

1.960 

2.326 

2.576 

00 

Fuente:  De  "Table  of  Percentage  Points  of  the  f-Distribution",  Biometrika  32  ( 1 94 1  ):300.  Reproducida  con 
permiso  de  los  fideicomisarios  de  Biometrika. 
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TABLA  5 

Valores  crfticos  de 
ji  cuadrada 


a 


0 

Xa 

df 

*995 

*990 

*.975 

*950 

*900 

1 

.0000393 

.0001571 

.0009821 

.0039321 

.0157908 

2 

.0100251 

.0201007 

.0506356 

.102587 

.210720 

3 

.0717212 

.114832 

.215795 

.351846 

.584375 

4 

.206990 

.297110 

.484419 

.710721 

1.063623 

5 

.411740 

.554300 

.831211 

1.145476 

1.61031 

6 

.675727 

.872085 

1 .237347 

1.63539 

2.20413 

7 

.989265 

1 .239043 

1.68987 

2.16735 

2.83311 

8 

1.344419 

1 .646482 

2.17973 

2.73264 

3.48954 

9 

1.734926 

2.087912 

2.70039 

3.32511 

4.16816 

10 

2.15585 

2.55821 

3.24697 

3.94030 

4.86518 

11 

2.60321 

3.05347 

3.81575 

4.57481 

5.57779 

12 

3.07382 

3.57056 

4.40379 

5.22603 

6.30380 

13 

3.56503 

4.10691 

5.00874 

5.89186 

7.04150 

14 

4.07468 

4.66043 

5.62872 

6.57063 

7.78953 

15 

4.60094 

5.22935 

6.26214 

7.26094 

8.54675 

16 

5.14224 

5.81221 

6.90766 

7.96164 

9.31223 

17 

5.69724 

6.40776 

7.56418 

8.67176 

10.0852 

18 

6.26481 

7.01491 

8.23075 

9.39046 

10.8649 

19 

6.84398 

7.63273 

8.90655 

10.1170 

11.6509 

20 

7.43386 

8.26040 

9.59083 

10.8508 

12.4426 

21 

8.03366 

8.89720 

10.28293 

11.5913 

13.2396 

22 

8.64272 

9.54249 

10.9823 

12.3380 

14.0415 

23 

9.26042 

10.19567 

11.6885 

13.0905 

14.8479 

24 

9.88623 

10.8564 

12.4011 

13.8484 

15.6587 

25 

10.5197 

11.5240 

13.1197 

14.6114 

16.4734 

26 

11.1603 

12.1981 

13.8439 

15.3791 

17.2919 

27 

11.8076 

12.8786 

14.5733 

16.1513 

18.1 138 

28 

12.4613 

13.5648 

15.3079 

16.9279 

18.9392 

29 

13.1211 

14.2565 

16.0471 

17.7083 

19.7677 

30 

13.7867 

14.9535 

16.7908 

18.4926 

20.5992 

40 

20.7065 

22.1643 

24.4331 

26.5093 

29.0505 

50 

27.9907 

29.7067 

32.3574 

34.7642 

37.6886 

60 

35.5346 

37.4848 

40.4817 

43.1879 

46.4589 

70 

43.2752 

45.4418 

48.7576 

51.7393 

55.3290 

80 

51.1720 

53.5400 

57.1532 

60.3915 

64.2778 

90 

59.1963 

61.7541 

65.6466 

69.1260 

73.2912 

100 

67.3276 

70.0648 

74.2219 

77.9295 

82.3581 

Fuente:  De  "Tables  of  the  Percentage  Points  of  the  ^-Distribution",  Biometrika  Tables  for  Statisticians, 
vol.  2,  3a.  ed.  (1966).  Reproducida  con  permiso  de  los  fideicomisarios  de  Biometrika. 
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TABLA  5 

(continuacion) 


^.100 

X.olo 

X.025 

Xofo 

A'.oos 

df 

2.70554 

3.84146 

5.02389 

6.63490 

7.87944 

1 

4.60517 

5.99147 

7.37776 

9.21034 

10.5966 

2 

6.25139 

7.81473 

9.34840 

1 1 .3449 

12.8381 

3 

7.77944 

9.48773 

11.1433 

13.2767 

14.8602 

4 

9.23635 

11.0705 

12.8325 

15.0863 

16.7496 

5 

10.6446 

12.5916 

14.4494 

16.81 19 

18.5476 

6 

12.0170 

14.0671 

16.0128 

18.4753 

20.2777 

7 

13.3616 

15.5073 

17.5346 

20.0902 

21.9550 

8 

14.6837 

16.9190 

19.0228 

21.6660 

23.5893 

9 

15.9871 

18.3070 

20.4831 

23.2093 

25.1882 

10 

17.2750 

19.6751 

21.9200 

24.7250 

26.7569 

11 

18.5494 

21.0261 

23.3367 

26.2170 

28.2995 

12 

19.8119 

22.3621 

24.7356 

27.6883 

29.8194 

13 

21.0642 

23.6848 

26.1190 

29.1413 

31.3193 

14 

22.3072 

24.9958 

27.4884 

30.5779 

32.8013 

15 

23.5418 

26.2962 

28.8485 

31.9999 

34.2672 

16 

24.7690 

27.8571 

30.1910 

33.4087 

35.7185 

17 

25.9894 

28.8693 

31.5264 

34.8053 

37.1564 

18 

27.2036 

30.1435 

32.8523 

36.1908 

38.5822 

19 

28.4120 

31.4104 

34.1696 

37.5662 

39.9968 

20 

29.6151 

32.6705 

35.4789 

38.9321 

41.4010 

21 

30.8133 

33.9244 

36.7807 

40.2894 

42.7956 

22 

32.0069 

35.1725 

38.0757 

41.6384 

44.1813 

23 

33.1963 

36.4151 

39.3641 

42.9798 

45.5585 

24 

34.3816 

37.6525 

40.6465 

44.3141 

46.9278 

25 

35.5631 

38.8852 

41.9232 

45.6417 

48.2899 

26 

36.7412 

40.1133 

43.1944 

46.9630 

49.6449 

27 

37.9159 

41.3372 

44.4607 

48.2782 

50.9933 

28 

39.0875 

42.5569 

45.7222 

49.5879 

52.3356 

29 

40.2560 

43.7729 

46.9792 

50.8922 

53.6720 

30 

51.8050 

55.7585 

59.3417 

63.6907 

66.7659 

40 

63.1671 

67.5048 

71.4202 

76.1539 

79.4900 

50 

74.3970 

79.0819 

83.2976 

88.3794 

91.9517 

60 

85.5271 

90.5312 

95.0231 

100.425 

104.215 

70 

96.5782 

101.879 

106.629 

112.329 

116.321 

80 

107.565 

113.145 

118.136 

124.116 

128.299 

90 

1 18.498 

124.342 

129.561 

135.807 

140.169 

100 
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TABLA  6  Puntos  porcentuales  de  la  distribucion  F 


df2 

a 

df i 

1 

2 

3 

4 

5 

6 

7 

8 

9 

1 

.100 

39.86 

49.50 

53.59 

55.83 

57.24 

58.20 

58.91 

59.44 

59.86 

.050 

161.4 

199.5 

215.7 

224.6 

230.2 

234.0 

236.8 

238.9 

240.5 

.025 

647.8 

799.5 

864.2 

899.6 

921.8 

937.1 

948.2 

956.7 

963.3 

.010 

4052 

4999.5 

5403 

5625 

5764 

5859 

5928 

5982 

6022 

.005 

16211 

20000 

21615 

22500 

23056 

23437 

23715 

23925 

24091 

2 

.100 

8.53 

9.00 

9.16 

9.24 

9.29 

9.33 

9.35 

9.37 

9.38 

.050 

18.51 

19.00 

19.16 

19.25 

19.30 

19.33 

19.35 

19.37 

19.38 

.025 

38.51 

39.00 

39.17 

39.25 

39.30 

39.33 

39.36 

39.37 

39.39 

.010 

98.50 

99.00 

99.17 

99.25 

99.30 

99.33 

99.36 

99.37 

99.39 

.005 

198.5 

199.0 

199.2 

199.2 

199.3 

199.3 

199.4 

199.4 

199.4 

3 

.100 

5.54 

5.46 

5.39 

5.34 

5.31 

5.28 

5.27 

5.25 

5.24 

.050 

10.13 

9.55 

9.28 

9.12 

9.01 

8.94 

8.89 

8.85 

8.81 

.025 

17.44 

16.04 

15.44 

15.10 

14.88 

14.73 

14.62 

14.54 

14.47 

.010 

34.12 

30.82 

29.46 

28.71 

28.24 

27.91 

27.64 

27.49 

27.35 

.005 

55.55 

49.80 

47.47 

46.19 

45.39 

44.84 

44.43 

44.13 

43.88 

4 

.100 

4.54 

4.32 

4.19 

4.1 1 

4.05 

4.01 

3.98 

3.95 

3.94 

.050 

7.71 

6.94 

6.59 

6.39 

6.26 

6.16 

6.09 

6.04 

6.00 

.025 

12.22 

10.65 

9.98 

9.60 

9.36 

9.20 

9.07 

8.98 

8.90 

.010 

21.20 

18.00 

16.69 

15.98 

15.52 

15.21 

14.98 

14.80 

14.66 

.005 

31.33 

26.28 

24.26 

23.15 

22.46 

21.97 

21.62 

21.35 

21.14 

5 

.100 

4.06 

3.78 

3.62 

3.52 

3.45 

3.40 

3.37 

3.34 

3.32 

.050 

6.61 

5.79 

5.41 

5.19 

5.05 

4.95 

4.88 

4.82 

4.77 

.025 

10.01 

8.43 

7.76 

7.39 

7.15 

6.98 

6.85 

6.76 

6.68 

.010 

16.26 

13.27 

12.06 

11.39 

10.97 

10.67 

10.46 

10.29 

10.16 

.005 

22.78 

18.31 

16.53 

15.56 

14.94 

14.51 

14.20 

13.96 

13.77 

6 

.100 

3.78 

3.46 

3.29 

3.18 

3.1 1 

3.05 

3.01 

2.98 

2.96 

.050 

5.99 

5.14 

4.76 

4.53 

4.39 

4.28 

4.21 

4.15 

4.10 

.025 

8.81 

7.26 

6.60 

6.23 

5.99 

5.82 

5.70 

5.60 

5.52 

.010 

13.75 

10.92 

9.78 

9.15 

8.75 

8.47 

8.26 

8.10 

7.98 

.005 

18.63 

14.54 

12.92 

12.03 

11.46 

11.07 

10.79 

10.57 

10.39 

7 

.100 

3.59 

3.26 

3.07 

2.96 

2.88 

2.83 

2.78 

2.75 

2.72 

.050 

5.59 

4.74 

4.35 

4.12 

3.97 

3.87 

3.79 

3.73 

3.68 

.025 

8.07 

6.54 

5.89 

5.52 

5.29 

5.12 

4.99 

4.90 

4.82 

.010 

12.25 

9.55 

8.45 

7.85 

7.46 

7.19 

6.99 

6.84 

6.72 

.005 

16.24 

12.40 

10.88 

10.05 

9.52 

9.16 

8.89 

8.68 

8.51 

8 

.100 

3.46 

3.11 

2.92 

2.81 

2.73 

2.67 

2.62 

2.59 

2.56 

.050 

5.32 

4.46 

4.07 

3.84 

3.69 

3.58 

3.50 

3.44 

3.39 

.025 

7.57 

6.06 

5.42 

5.05 

4.82 

4.65 

4.53 

4.43 

4.36 

.010 

11.26 

8.65 

7.59 

7.01 

6.63 

6.37 

6.18 

6.03 

5.91 

.005 

14.69 

11.04 

9.60 

8.81 

8.30 

7.95 

7.69 

7.50 

7.34 

9 

.100 

3.36 

3.01 

2.81 

2.69 

2.61 

2.55 

2.51 

2.47 

2.44 

.050 

5.12 

4.26 

3.86 

3.63 

3.48 

3.37 

3.29 

3.23 

3.18 

.025 

7.21 

5.71 

5.08 

4.72 

4.48 

4.32 

4.20 

4.10 

4.03 

.010 

10.56 

8.02 

6.99 

6.42 

6.06 

5.80 

5.61 

5.47 

5.35 

.005 

13.61 

10.11 

8.72 

7.96 

7.47 

7.13 

6.88 

6.69 

6.54 

Fuente:  Parte  de  "Tables  of  Percentage  Points  of  the  Inverted  Beta  (F)  Distribution",  Biometrika,  vol.  33  (1 943)  por  M.  Merrington  y  C.M. 
Thompson  y  de  la  tabla  18  de  Biometrika  Tables  for  Statisticians,  vol.  1,  Cambridge  University  Press,  1954,  editado  por  E.S.  Pearson 
y  H.O.  Hartley.  Reproducida  con  permiso  de  los  autores,  editores  y  los  fideicomisarios  de  Biometrika. 
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TABLA  6  (continuacion) 


df, 


10 

12 

15 

20 

24 

30 

40 

60 

120 

00 

a 

df2 

60.19 

60.71 

61.22 

61.74 

62.00 

62.26 

62.53 

62.79 

63.06 

63.33 

.100 

1 

241.9 

243.9 

245.9 

248.0 

249.1 

250.1 

251.2 

252.2 

253.3 

254.3 

.050 

968.6 

976.7 

984.9 

993.1 

997.2 

1001 

1006 

1010 

1014 

1018 

.025 

6056 

6106 

6157 

6209 

6235 

6261 

6287 

6313 

6339 

6366 

.010 

24224 

24426 

24630 

24836 

24940 

25044 

25148 

25253 

25359 

25465 

.005 

9.39 

9.41 

9.42 

9.44 

9.45 

9.46 

9.47 

9.47 

9.48 

9.49 

.100 

2 

19.40 

19.41 

19.43 

19.45 

19.45 

19.46 

19.47 

19.48 

19.49 

19.50 

.050 

39.40 

39.41 

39.43 

39.45 

39.46 

39.46 

39.47 

39.48 

39.49 

39.50 

.025 

99.40 

99.42 

99.43 

99.45 

99.46 

99.47 

99.47 

99.48 

99.49 

99.50 

.010 

199.4 

199.4 

199.4 

199.4 

199.5 

199.5 

199.5 

199.5 

199.5 

199.5 

.005 

5.23 

5.22 

5.20 

5.18 

5.18 

5.17 

5.16 

5.15 

5.14 

5.13 

.100 

3 

8.79 

8.74 

8.70 

8.66 

8.64 

8.62 

8.59 

8.57 

8.55 

8.53 

.050 

14.42 

14.34 

14.25 

14.17 

14.12 

14.08 

14.04 

13.99 

13.95 

13.90 

.025 

21.21 

27.05 

26.87 

26.69 

26.60 

26.50 

26.41 

26.32 

26.22 

26.13 

.010 

43.69 

43.39 

43.08 

42.78 

42.62 

42.47 

42.31 

42.15 

41.99 

41.83 

.005 

3.92 

3.90 

3.87 

3.84 

3.83 

3.82 

3.80 

3.79 

3.78 

3.76 

.100 

4 

5.96 

5.91 

5.86 

5.80 

5.77 

5.75 

5.72 

5.69 

5.66 

5.63 

.050 

8.84 

8.75 

8.66 

8.56 

8.51 

8.46 

8.41 

8.36 

8.31 

8.26 

.025 

14.55 

14.37 

14.20 

14.02 

13.93 

13.84 

13.75 

13.65 

13.56 

13.46 

.010 

20.97 

20.70 

20.44 

20.17 

20.03 

19.89 

19.75 

19.61 

19.47 

19.32 

.005 

3.30 

3.27 

3.24 

3.21 

3.19 

3.17 

3.16 

3.14 

3.12 

3.10 

.100 

5 

4.74 

4.68 

4.62 

4.56 

4.53 

4.50 

4.46 

4.43 

4.40 

4.36 

.050 

6.62 

6.52 

6.43 

6.33 

6.28 

6.23 

6.18 

6.12 

6.07 

6.02 

.025 

10.05 

9.89 

9.72 

9.55 

9.47 

9.38 

9.29 

9.20 

9.11 

9.02 

.010 

13.62 

13.38 

13.15 

12.90 

12.78 

12.66 

12.53 

12.40 

12.27 

12.14 

.005 

2.94 

2.90 

2.87 

2.84 

2.82 

2.80 

2.78 

2.76 

2.74 

2.72 

.100 

6 

4.06 

4.00 

3.94 

3.87 

3.84 

3.81 

3.77 

3.74 

3.70 

3.67 

.050 

5.46 

5.37 

5.27 

5.17 

5.12 

5.07 

5.01 

4.96 

4.90 

4.85 

.025 

7.87 

7.72 

7.56 

7.40 

7.31 

7.23 

7.14 

7.06 

6.97 

6.88 

.010 

10.25 

10.03 

9.81 

9.59 

9.47 

9.36 

9.24 

9.12 

9.00 

8.88 

.005 

2.70 

2.67 

2.63 

2.59 

2.58 

2.56 

2.54 

2.51 

2.49 

2.47 

.100 

7 

3.64 

3.57 

3.51 

3.44 

3.41 

3.38 

3.34 

3.30 

3.27 

3.23 

.050 

4.76 

4.67 

4.57 

4.47 

4.42 

4.36 

4.31 

4.25 

4.20 

4.14 

.025 

6.62 

6.47 

6.31 

6.16 

6.07 

5.99 

5.91 

5.82 

5.74 

5.65 

.010 

8.38 

8.18 

7.97 

7.75 

7.65 

7.53 

7.42 

7.31 

7.19 

7.08 

.005 

2.54 

2.50 

2.46 

2.42 

2.40 

2.38 

2.36 

2.34 

2.32 

2.29 

.100 

8 

3.35 

3.28 

3.22 

3.15 

3.12 

3.08 

3.04 

3.01 

2.97 

2.93 

.050 

4.30 

4.20 

4.10 

4.00 

3.95 

3.89 

3.84 

3.78 

3.73 

3.67 

.025 

5.81 

5.67 

5.52 

5.36 

5.28 

5.20 

5.12 

5.03 

4.95 

4.86 

.010 

7.21 

7.01 

6.81 

6.61 

6.50 

6.40 

6.29 

6.18 

6.06 

5.95 

.005 

2.42 

2.38 

2.34 

2.30 

2.28 

2.25 

2.23 

2.21 

2.18 

2.16 

.100 

9 

3.14 

3.07 

3.01 

2.94 

2.90 

2.86 

2.83 

2.79 

2.75 

2.71 

.050 

3.96 

3.87 

3.77 

3.67 

3.61 

3.56 

3.51 

3.45 

3.39 

3.33 

.025 

5.26 

5.1 1 

4.96 

4.81 

4.73 

4.65 

4.57 

4.48 

4.40 

4.31 

.010 

6.42 

6.23 

6.03 

5.83 

5.73 

5.62 

5.52 

5.41 

5.30 

5.19 

.005 
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TABLA  6  (continuacion) 


df2 

df i 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

.100 

3.29 

2.92 

2.73 

2.61 

2.52 

2.46 

2.41 

2.38 

2.35 

.050 

4.96 

4.10 

3.71 

3.48 

3.33 

3.22 

3.14 

3.07 

3.02 

.025 

6.94 

5.46 

4.83 

4.47 

4.24 

4.07 

3.95 

3.85 

3.78 

.010 

10.04 

7.56 

6.55 

5.99 

5.64 

5.39 

5.20 

5.06 

4.94 

.005 

12.83 

9.43 

8.08 

7.34 

6.87 

6.54 

6.30 

6.12 

5.97 

11 

.100 

3.23 

2.86 

2.66 

2.54 

2.45 

2.39 

2.34 

2.30 

2.27 

.050 

4.84 

3.98 

3.59 

3.36 

3.20 

3.09 

3.01 

2.95 

2.90 

.025 

6.72 

5.26 

4.63 

4.28 

4.04 

3.88 

3.76 

3.66 

3.59 

.010 

9.65 

7.21 

6.22 

5.67 

5.32 

5.07 

4.89 

4.74 

4.63 

.005 

12.23 

8.91 

7.60 

6.88 

6.42 

6.10 

5.86 

5.68 

5.54 

12 

.100 

3.18 

2.81 

2.61 

2.48 

2.39 

2.33 

2.28 

2.24 

2.21 

.050 

4.75 

3.89 

3.49 

3.26 

3.11 

3.00 

2.91 

2.85 

2.80 

.025 

6.55 

5.10 

4.47 

4.12 

3.89 

3.73 

3.61 

3.51 

3.44 

.010 

9.33 

6.93 

5.95 

5.41 

5.06 

4.82 

4.64 

4.50 

4.39 

.005 

11.75 

8.51 

7.23 

6.52 

6.07 

5.76 

5.52 

5.35 

5.20 

13 

.100 

3.14 

2.76 

2.56 

2.43 

2.35 

2.28 

2.23 

2.20 

2.16 

.050 

4.67 

3.81 

3.41 

3.18 

3.03 

2.92 

2.83 

2.77 

2.71 

.025 

6.41 

4.97 

4.35 

4.00 

3.77 

3.60 

3.48 

3.39 

3.31 

.010 

9.07 

6.70 

5.74 

5.21 

4.86 

4.62 

4.44 

4.30 

4.19 

.005 

11.37 

8.19 

6.93 

6.23 

5.79 

5.48 

5.25 

5.08 

4.94 

14 

.100 

3.10 

2.73 

2.52 

2.39 

2.31 

2.24 

2.19 

2.15 

2.12 

.050 

4.60 

3.74 

3.34 

3.11 

2.96 

2.85 

2.76 

2.70 

2.65 

.025 

6.30 

4.86 

4.24 

3.89 

3.66 

3.50 

3.38 

3.29 

3.21 

.010 

8.86 

6.51 

5.56 

5.04 

4.69 

4.46 

4.28 

4.14 

4.03 

.005 

11.06 

7.92 

6.68 

6.00 

5.56 

5.26 

5.03 

4.86 

4.72 

15 

.100 

3.07 

2.70 

2.49 

2.36 

2.27 

2.21 

2.16 

2.12 

2.09 

.050 

4.54 

3.68 

3.29 

3.06 

2.90 

2.79 

2.71 

2.64 

2.59 

.025 

6.20 

4.77 

4.15 

3.80 

3.58 

3.41 

3.29 

3.20 

3.12 

.010 

8.68 

6.36 

5.42 

4.89 

4.56 

4.32 

4.14 

4.00 

3.89 

.005 

10.80 

7.70 

6.48 

5.80 

5.37 

5.07 

4.85 

4.67 

4.54 

16 

.100 

3.05 

2.67 

2.46 

2.33 

2.24 

2.18 

2.13 

2.09 

2.06 

.050 

4.49 

3.63 

3.24 

3.01 

2.85 

2.74 

2.66 

2.59 

2.54 

.025 

6.12 

4.69 

4.08 

3.73 

3.50 

3.34 

3.22 

3.12 

3.05 

.010 

8.53 

6.23 

5.29 

4.77 

4.44 

4.20 

4.03 

3.89 

3.78 

.005 

10.58 

7.51 

6.30 

5.64 

5.21 

4.91 

4.69 

4.52 

4.38 

17 

.100 

3.03 

2.64 

2.44 

2.31 

2.22 

2.15 

2.10 

2.06 

2.03 

.050 

4.45 

3.59 

3.20 

2.96 

2.81 

2.70 

2.61 

2.55 

2.49 

.025 

6.04 

4.62 

4.01 

3.66 

3.44 

3.28 

3.16 

3.06 

2.98 

.010 

8.40 

6.11 

5.18 

4.67 

4.34 

4.10 

3.93 

3.79 

3.68 

.005 

10.38 

7.35 

6.16 

5.50 

5.07 

4.78 

4.56 

4.39 

4.25 

18 

.100 

3.01 

2.62 

2.42 

2.29 

2.20 

2.13 

2.08 

2.04 

2.00 

.050 

4.41 

3.55 

3.16 

2.93 

2.77 

2.66 

2.58 

2.51 

2.46 

.025 

5.98 

4.56 

3.95 

3.61 

3.38 

3.22 

3.10 

3.01 

2.93 

.010 

8.29 

6.01 

5.09 

4.58 

4.25 

4.01 

3.84 

3.71 

3.60 

.005 

10.22 

7.21 

6.03 

5.37 

4.96 

4.66 

4.44 

4.28 

4.14 

19 

.100 

2.99 

2.61 

2.40 

2.27 

2.18 

2.11 

2.06 

2.02 

1.98 

.050 

4.38 

3.52 

3.13 

2.90 

2.74 

2.63 

2.54 

2.48 

2.42 

.025 

5.92 

4.51 

3.90 

3.56 

3.33 

3.17 

3.05 

2.96 

2.88 

.010 

8.18 

5.93 

5.01 

4.50 

4.17 

3.94 

3.77 

3.63 

3.52 

.005 

10.07 

7.09 

5.92 

5.27 

4.85 

4.56 

4.34 

4.18 

4.04 

20 

.100 

2.97 

2.59 

2.38 

2.25 

2.16 

2.09 

2.04 

2.00 

1.96 

.050 

4.35 

3.49 

3.10 

2.87 

2.71 

2.60 

2.51 

2.45 

2.39 

.025 

5.87 

4.46 

3.86 

3.51 

3.29 

3.13 

3.01 

2.91 

2.84 

.010 

8.10 

5.85 

4.94 

4.43 

4.10 

3.87 

3.70 

3.56 

3.46 

.005 

9.94 

6.99 

5.82 

5.17 

4.76 

4.47 

4.26 

4.09 

3.96 
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TABLA  6  (continuacion) 


df i 


10 

12 

15 

20 

24 

30 

40 

60 

120 

00 

a 

df2 

2.32 

2.28 

2.24 

2.20 

2.18 

2.16 

2.13 

2.11 

2.08 

2.06 

.100 

10 

2.98 

2.91 

2.85 

2.77 

2.74 

2.70 

2.66 

2.62 

2.58 

2.54 

.050 

3.72 

3.62 

3.52 

3.42 

3.37 

3.31 

3.26 

3.20 

3.14 

3.08 

.025 

4.85 

4.71 

4.56 

4.41 

4.33 

4.25 

4.17 

4.08 

4.00 

3.91 

.010 

5.85 

5.66 

5.47 

5.27 

5.17 

5.07 

4.97 

4.86 

4.75 

4.64 

.005 

2.25 

2.21 

2.17 

2.12 

2.10 

2.08 

2.05 

2.03 

2.00 

1.97 

.100 

11 

2.85 

2.79 

2.72 

2.65 

2.61 

2.57 

2.53 

2.49 

2.45 

2.40 

.050 

3.53 

3.43 

3.33 

3.23 

3.17 

3.12 

3.06 

3.00 

2.94 

2.88 

.025 

4.54 

4.40 

4.25 

4.10 

4.02 

3.94 

3.86 

3.78 

3.69 

3.60 

.010 

5.42 

5.24 

5.05 

4.86 

4.76 

4.65 

4.55 

4.44 

4.34 

4.23 

.005 

2.19 

2.15 

2.10 

2.06 

2.04 

2.01 

1.99 

1.96 

1.93 

1.90 

.100 

12 

2.75 

2.69 

2.62 

2.54 

2.51 

2.47 

2.43 

2.38 

2.34 

2.30 

.050 

3.37 

3.28 

3.18 

3.07 

3.02 

2.96 

2.91 

2.85 

2.79 

2.72 

.025 

4.30 

4.16 

4.01 

3.86 

3.78 

3.70 

3.62 

3.54 

3.45 

3.36 

.010 

5.09 

4.91 

4.72 

4.53 

4.43 

4.33 

4.23 

4.12 

4.01 

3.90 

.005 

2.14 

2.10 

2.05 

2.01 

1.98 

1.96 

1.93 

1.90 

1.88 

1.85 

.100 

13 

2.67 

2.60 

2.53 

2.46 

2.42 

2.38 

2.34 

2.30 

2.25 

2.21 

.050 

3.25 

3.15 

3.05 

2.95 

2.89 

2.84 

2.78 

2.72 

2.66 

2.60 

.025 

4.10 

3.96 

3.82 

3.66 

3.59 

3.51 

3.43 

3.34 

3.25 

3.17 

.010 

4.82 

4.64 

4.46 

4.27 

4.17 

4.07 

3.97 

3.87 

3.76 

3.65 

.005 

2.10 

2.05 

2.01 

1.96 

1.94 

1.91 

1.89 

1.86 

1.83 

1.80 

.100 

14 

2.60 

2.53 

2.46 

2.39 

2.35 

2.31 

2.27 

2.22 

2.18 

2.13 

.050 

3.15 

3.05 

2.95 

2.84 

2.79 

2.73 

2.67 

2.61 

2.55 

2.49 

.025 

3.94 

3.80 

3.66 

3.51 

3.43 

3.35 

3.27 

3.18 

3.09 

3.00 

.010 

4.60 

4.43 

4.25 

4.06 

3.96 

3.86 

3.76 

3.66 

3.55 

3.44 

.005 

2.06 

2.02 

1.97 

1.92 

1.90 

1.87 

1.85 

1.82 

1.79 

1.76 

.100 

15 

2.54 

2.48 

2.40 

2.33 

2.29 

2.25 

2.20 

2.16 

2.11 

2.07 

.050 

3.06 

2.96 

2.86 

2.76 

2.70 

2.64 

2.59 

2.52 

2.46 

2.40 

.025 

3.80 

3.67 

3.52 

3.37 

3.29 

3.21 

3.13 

3.05 

2.96 

2.87 

.010 

4.42 

4.25 

4.07 

3.88 

3.79 

3.69 

3.58 

3.48 

3.37 

3.26 

.005 

2.03 

1.99 

1.94 

1.89 

1.87 

1.84 

1.81 

1.78 

1.75 

1.72 

.100 

16 

2.49 

2.42 

2.35 

2.28 

2.24 

2.19 

2.15 

2.11 

2.06 

2.01 

.050 

2.99 

2.89 

2.79 

2.68 

2.63 

2.57 

2.51 

2.45 

2.38 

2.32 

.025 

3.69 

3.55 

3.41 

3.26 

3.18 

3.10 

3.02 

2.93 

2.84 

2.75 

.010 

4.27 

4.10 

3.92 

3.73 

3.64 

3.54 

3.44 

3.33 

3.22 

3.11 

.005 

2.00 

1.96 

1.91 

1.86 

1.84 

1.81 

1.78 

1.75 

1.72 

1.69 

.100 

17 

2.45 

2.38 

2.31 

2.23 

2.19 

2.15 

2.10 

2.06 

2.01 

1.96 

.050 

2.92 

2.82 

2.72 

2.62 

2.56 

2.50 

2.44 

2.38 

2.32 

2.25 

.025 

3.59 

3.46 

3.31 

3.16 

3.08 

3.00 

2.92 

2.83 

2.75 

2.65 

.010 

4.14 

3.97 

3.79 

3.61 

3.51 

3.41 

3.31 

3.21 

3.10 

2.98 

.005 

1.98 

1.93 

1.89 

1.84 

1.81 

1.78 

1.75 

1.72 

1.69 

1.66 

.100 

18 

2.41 

2.34 

2.27 

2.19 

2.15 

2.11 

2.06 

2.02 

1.97 

1.92 

.050 

2.87 

2.77 

2.67 

2.56 

2.50 

2.44 

2.38 

2.32 

2.26 

2.19 

.025 

3.51 

3.37 

3.23 

3.08 

3.00 

2.92 

2.84 

2.75 

2.66 

2.57 

.010 

4.03 

3.86 

3.68 

3.50 

3.40 

3.30 

3.20 

3.10 

2.99 

2.87 

.005 

1.96 

1.91 

1.86 

1.81 

1.79 

1.76 

1.73 

1.70 

1.67 

1.63 

.100 

19 

2.38 

2.31 

2.23 

2.16 

2.11 

2.07 

2.03 

1.98 

1.93 

1.88 

.050 

2.82 

2.72 

2.62 

2.51 

2.45 

2.39 

2.33 

2.27 

2.20 

2.13 

.025 

3.43 

3.30 

3.15 

3.00 

2.92 

2.84 

2.76 

2.67 

2.58 

2.49 

.010 

3.93 

3.76 

3.59 

3.40 

3.31 

3.21 

3.11 

3.00 

2.89 

2.78 

.005 

1.94 

1.89 

1.84 

1.79 

1.77 

1.74 

1.71 

1.68 

1.64 

1.61 

.100 

20 

2.35 

2.28 

2.20 

2.12 

2.08 

2.04 

1.99 

1.95 

1.90 

1.84 

.050 

2.77 

2.68 

2.57 

2.46 

2.41 

2.35 

2.29 

2.22 

2.16 

2.09 

.025 

3.37 

3.23 

3.09 

2.94 

2.86 

2.78 

2.69 

2.61 

2.52 

2.42 

.010 

3.85 

3.68 

3.50 

3.32 

3.22 

3.12 

3.02 

2.92 

2.81 

2.69 

.005 
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TABLA  6  (continuacion) 


df2 

df i 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

21 

.100 

2.96 

2.57 

2.36 

2.23 

2.14 

2.08 

2.02 

1.98 

1.95 

.050 

4.32 

3.47 

3.07 

2.84 

2.68 

2.57 

2.49 

2.42 

2.37 

.025 

5.83 

4.42 

3.82 

3.48 

3.25 

3.09 

2.97 

2.87 

2.80 

.010 

8.02 

5.78 

4.87 

4.37 

4.04 

3.81 

3.64 

3.51 

3.40 

.005 

9.83 

6.89 

5.73 

5.09 

4.68 

4.39 

4.18 

4.01 

3.88 

22 

.100 

2.95 

2.56 

2.35 

2.22 

2.13 

2.06 

2.01 

1.97 

1.93 

.050 

4.30 

3.44 

3.05 

2.82 

2.66 

2.55 

2.46 

2.40 

2.34 

.025 

5.79 

4.38 

3.78 

3.44 

3.22 

3.05 

2.93 

2.84 

2.76 

.010 

7.95 

5.72 

4.82 

4.31 

3.99 

3.76 

3.59 

3.45 

3.35 

.005 

9.73 

6.81 

5.65 

5.02 

4.61 

4.32 

4.11 

3.94 

3.81 

23 

.100 

2.94 

2.55 

2.34 

2.21 

2.11 

2.05 

1.99 

1.95 

1.92 

.050 

4.28 

3.42 

3.03 

2.80 

2.64 

2.53 

2.44 

2.37 

2.32 

.025 

5.75 

4.35 

3.75 

3.41 

3.18 

3.02 

2.90 

2.81 

2.73 

.010 

7.88 

5.66 

4.76 

4.26 

3.94 

3.71 

3.54 

3.41 

3.30 

.005 

9.63 

6.73 

5.58 

4.95 

4.54 

4.26 

4.05 

3.88 

3.75 

24 

.100 

2.93 

2.54 

2.33 

2.19 

2.10 

2.04 

1.98 

1.94 

1.91 

.050 

4.26 

3.40 

3.01 

2.78 

2.62 

2.51 

2.42 

2.36 

2.30 

.025 

5.72 

4.32 

3.72 

3.38 

3.15 

2.99 

2.87 

2.78 

2.70 

.010 

7.82 

5.61 

4.72 

4.22 

3.90 

3.67 

3.50 

3.36 

3.26 

.005 

9.55 

6.66 

5.52 

4.89 

4.49 

4.20 

3.99 

3.83 

3.69 

25 

.100 

2.92 

2.53 

2.32 

2.18 

2.09 

2.02 

1.97 

1.93 

1.89 

.050 

4.24 

3.39 

2.99 

2.76 

2.60 

2.49 

2.40 

2.34 

2.28 

.025 

5.69 

4.29 

3.69 

3.35 

3.13 

2.97 

2.85 

2.75 

2.68 

.010 

7.77 

5.57 

4.68 

4.18 

3.85 

3.63 

3.46 

3.32 

3.22 

.005 

9.48 

6.60 

5.46 

4.84 

4.43 

4.15 

3.94 

3.78 

3.64 

26 

.100 

2.91 

2.52 

2.31 

2.17 

2.08 

2.01 

1.96 

1.92 

1.88 

.050 

4.23 

3.37 

2.98 

2.74 

2.59 

2.47 

2.39 

2.32 

2.27 

.025 

5.66 

4.27 

3.67 

3.33 

3.10 

2.94 

2.82 

2.73 

2.65 

.010 

7.72 

5.53 

4.64 

4.14 

3.82 

3.59 

3.42 

3.29 

3.18 

.005 

9.41 

6.54 

5.41 

4.79 

4.38 

4.10 

3.89 

3.73 

3.60 

27 

.100 

2.90 

2.51 

2.30 

2.17 

2.07 

2.00 

1.95 

1.91 

1.87 

.050 

4.21 

3.35 

2.96 

2.73 

2.57 

2.46 

2.37 

2.31 

2.25 

.025 

5.63 

4.24 

3.65 

3.31 

3.08 

2.92 

2.80 

2.71 

2.63 

.010 

7.68 

5.49 

4.60 

4.11 

3.78 

3.56 

3.39 

3.26 

3.15 

.005 

9.34 

6.49 

5.36 

4.74 

4.34 

4.06 

3.85 

3.69 

3.56 

28 

.100 

2.89 

2.50 

2.29 

2.16 

2.06 

2.00 

1.94 

1.90 

1.87 

.050 

4.20 

3.34 

2.95 

2.71 

2.56 

2.45 

2.36 

2.29 

2.24 

.025 

5.61 

4.22 

3.63 

3.29 

3.06 

2.90 

2.78 

2.69 

2.61 

.010 

7.64 

5.45 

4.57 

4.07 

3.75 

3.53 

3.36 

3.23 

3.12 

.005 

9.28 

6.44 

5.32 

4.70 

4.30 

4.02 

3.81 

3.65 

3.52 

29 

.100 

2.89 

2.50 

2.28 

2.15 

2.06 

1.99 

1.93 

1.89 

1.86 

.050 

4.18 

3.33 

2.93 

2.70 

2.55 

2.43 

2.35 

2.28 

2.22 

.025 

5.59 

4.20 

3.61 

3.27 

3.04 

2.88 

2.76 

2.67 

2.59 

.010 

7.60 

5.42 

4.54 

4.04 

3.73 

3.50 

3.33 

3.20 

3.09 

.005 

9.23 

6.40 

5.28 

4.66 

4.26 

3.98 

3.77 

3.61 

3.48 

30 

.100 

2.88 

2.49 

2.28 

2.14 

2.05 

1.98 

1.93 

1.88 

1.85 

.050 

4.17 

3.32 

2.92 

2.69 

2.53 

2.42 

2.33 

2.27 

2.21 

.025 

5.57 

4.18 

3.59 

3.25 

3.03 

2.87 

2.75 

2.65 

2.57 

.010 

7.56 

5.39 

4.51 

4.02 

3.70 

3.47 

3.30 

3.17 

3.07 

.005 

9.18 

6.35 

5.24 

4.62 

4.23 

3.95 

3.74 

3.58 

3.45 
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TABLA  6  (continuacion) 


df i 


10 

12 

15 

20 

24 

30 

40 

60 

120 

00 

a 

df2 

1.92 

1.87 

1.83 

1.78 

1.75 

1.72 

1.69 

1.66 

1.62 

1.59 

.100 

21 

2.32 

2.25 

2.18 

2.10 

2.05 

2.01 

1.96 

1.92 

1.87 

1.81 

.050 

2.73 

2.64 

2.53 

2.42 

2.37 

2.31 

2.25 

2.18 

2.11 

2.04 

.025 

3.31 

3.17 

3.03 

2.88 

2.80 

2.72 

2.64 

2.55 

2.46 

2.36 

.010 

3.77 

3.60 

3.43 

3.24 

3.15 

3.05 

2.95 

2.84 

2.73 

2.61 

.005 

1.90 

1.86 

1.81 

1.76 

1.73 

1.70 

1.67 

1.64 

1.60 

1.57 

.100 

22 

2.30 

2.23 

2.15 

2.07 

2.03 

1.98 

1.94 

1.89 

1.84 

1.78 

.050 

2.70 

2.60 

2.50 

2.39 

2.33 

2.27 

2.21 

2.14 

2.08 

2.00 

.025 

3.26 

3.12 

2.98 

2.83 

2.75 

2.67 

2.58 

2.50 

2.40 

2.31 

.010 

3.70 

3.54 

3.36 

3.18 

3.08 

2.98 

2.88 

2.77 

2.66 

2.55 

.005 

1.89 

1.84 

1.80 

1.74 

1.72 

1.69 

1.66 

1.62 

1.59 

1.55 

.100 

23 

2.27 

2.20 

2.13 

2.05 

2.01 

1.96 

1.91 

1.86 

1.81 

1.76 

.050 

2.67 

2.57 

2.47 

2.36 

2.30 

2.24 

2.18 

2.11 

2.04 

1.97 

.025 

3.21 

3.07 

2.93 

2.78 

2.70 

2.62 

2.54 

2.45 

2.35 

2.26 

.010 

3.64 

3.47 

3.30 

3.12 

3.02 

2.92 

2.82 

2.71 

2.60 

2.48 

.005 

1.88 

1.83 

1.78 

1.73 

1.70 

1.67 

1.64 

1.61 

1.57 

1.53 

.100 

24 

2.25 

2.18 

2.11 

2.03 

1.98 

1.94 

1.89 

1.84 

1.79 

1.73 

.050 

2.64 

2.54 

2.44 

2.33 

2.27 

2.21 

2.15 

2.08 

2.01 

1.94 

.025 

3.17 

3.03 

2.89 

2.74 

2.66 

2.58 

2.49 

2.40 

2.31 

2.21 

.010 

3.59 

3.42 

3.25 

3.06 

2.97 

2.87 

2.77 

2.66 

2.55 

2.43 

.005 

1.87 

1.82 

1.77 

1.72 

1.69 

1.66 

1.63 

1.59 

1.56 

1.52 

.100 

25 

2.24 

2.16 

2.09 

2.01 

1.96 

1.92 

1.87 

1.82 

1.77 

1.71 

.050 

2.61 

2.51 

2.41 

2.30 

2.24 

2.18 

2.12 

2.05 

1.98 

1.91 

.025 

3.13 

2.99 

2.85 

2.70 

2.62 

2.54 

2.45 

2.36 

2.27 

2.17 

.010 

3.54 

3.37 

3.20 

3.01 

2.92 

2.82 

2.72 

2.61 

2.50 

2.38 

.005 

1.86 

1.81 

1.76 

1.71 

1.68 

1.65 

1.61 

1.58 

1.54 

1.50 

.100 

26 

2.22 

2.15 

2.07 

1.99 

1.95 

1.90 

1.85 

1.80 

1.75 

1.69 

.050 

2.59 

2.49 

2.39 

2.28 

2.22 

2.16 

2.09 

2.03 

1.95 

1.88 

.025 

3.09 

2.96 

2.81 

2.66 

2.58 

2.50 

2.42 

2.33 

2.23 

2.13 

.010 

3.49 

3.33 

3.15 

2.97 

2.87 

2.77 

2.67 

2.56 

2.45 

2.33 

.005 

1.85 

1.80 

1.75 

1.70 

1.67 

1.64 

1.60 

1.57 

1.53 

1.49 

.100 

27 

2.20 

2.13 

2.06 

1.97 

1.93 

1.88 

1.84 

1.79 

1.73 

1.67 

.050 

2.57 

2.47 

2.36 

2.25 

2.19 

2.13 

2.07 

2.00 

1.93 

1.85 

.025 

3.06 

2.93 

2.78 

2.63 

2.55 

2.47 

2.38 

2.29 

2.20 

2.10 

.010 

3.45 

3.28 

3.11 

2.93 

2.83 

2.73 

2.63 

2.52 

2.41 

2.29 

.005 

1.84 

1.79 

1.74 

1.69 

1.66 

1.63 

1.59 

1.56 

1.52 

1.48 

.100 

28 

2.19 

2.12 

2.04 

1.96 

1.91 

1.87 

1.82 

1.77 

1.71 

1.65 

.050 

2.55 

2.45 

2.34 

2.23 

2.17 

2.11 

2.05 

1.98 

1.91 

1.83 

.025 

3.03 

2.90 

2.75 

2.60 

2.52 

2.44 

2.35 

2.26 

2.17 

2.06 

.010 

3.41 

3.25 

3.07 

2.89 

2.79 

2.69 

2.59 

2.48 

2.37 

2.25 

.005 

1.83 

1.78 

1.73 

1.68 

1.65 

1.62 

1.58 

1.55 

1.51 

1.47 

.100 

29 

2.18 

2.10 

2.03 

1.94 

1.90 

1.85 

1.81 

1.75 

1.70 

1.64 

.050 

2.53 

2.43 

2.32 

2.21 

2.15 

2.09 

2.03 

1.96 

1.89 

1.81 

.025 

3.00 

2.87 

2.73 

2.57 

2.49 

2.41 

2.33 

2.23 

2.14 

2.03 

.010 

3.38 

3.21 

3.04 

2.86 

2.76 

2.66 

2.56 

2.45 

2.33 

2.21 

.005 

1.82 

1.77 

1.72 

1.67 

1.64 

1.61 

1.57 

1.54 

1.50 

1.46 

.100 

30 

2.16 

2.09 

2.01 

1.93 

1.89 

1.84 

1.79 

1.74 

1.68 

1.62 

.050 

2.51 

2.41 

2.31 

2.20 

2.14 

2.07 

2.01 

1.94 

1.87 

1.79 

.025 

2.98 

2.84 

2.70 

2.55 

2.47 

2.39 

2.30 

2.21 

2.11 

2.01 

.010 

3.34 

3.18 

3.01 

2.82 

2.73 

2.63 

2.52 

2.42 

2.30 

2.18 

.005 
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TABLA  6  (continuacion) 


df2 

df, 

a 

1 

2 

3 

4 

5 

6 

7 

8 

9 

40 

.100 

2.84 

2.44 

2.23 

2.09 

2.00 

1.93 

1.87 

1.83 

1.79 

.050 

4.08 

3.23 

2.84 

2.61 

2.45 

2.34 

2.25 

2.18 

2.12 

.025 

5.42 

4.05 

3.46 

3.13 

2.90 

2.74 

2.62 

2.53 

2.45 

.010 

7.31 

5.18 

4.31 

3.83 

3.51 

3.29 

3.12 

2.99 

2.89 

.005 

8.83 

6.07 

4.98 

4.37 

3.99 

3.71 

3.51 

3.35 

3.22 

60 

.100 

2.79 

2.39 

2.18 

2.04 

1.95 

1.87 

1.82 

1.77 

1.74 

.050 

4.00 

3.15 

2.76 

2.53 

2.37 

2.25 

2.17 

2.10 

2.04 

.025 

5.29 

3.93 

3.34 

3.01 

2.79 

2.63 

2.51 

2.41 

2.33 

.010 

7.08 

4.98 

4.13 

3.65 

3.34 

3.12 

2.95 

2.82 

2.72 

.005 

8.49 

5.79 

4.73 

4.14 

3.76 

3.49 

3.29 

3.13 

3.01 

120 

.100 

2.75 

2.35 

2.13 

1.99 

1.90 

1.82 

1.77 

1.72 

1.68 

.050 

3.92 

3.07 

2.68 

2.45 

2.29 

2.17 

2.09 

2.02 

1.96 

.025 

5.15 

3.80 

3.23 

2.89 

2.67 

2.52 

2.39 

2.30 

2.22 

.010 

6.85 

4.79 

3.95 

3.48 

3.17 

2.96 

2.79 

2.66 

2.56 

.005 

8.18 

5.54 

4.50 

3.92 

3.55 

3.28 

3.09 

2.93 

2.81 

00 

.100 

2.71 

2.30 

2.08 

1.94 

1.85 

1.77 

1.72 

1.67 

1.63 

.050 

3.84 

3.00 

2.60 

2.37 

2.21 

2.10 

2.01 

1.94 

1.63 

.025 

5.02 

3.69 

3.12 

2.79 

2.57 

2.41 

2.29 

2.19 

2.11 

.010 

6.63 

4.61 

3.78 

3.32 

3.02 

2.80 

2.64 

2.51 

2.41 

.005 

7.88 

5.30 

4.28 

3.72 

3.35 

3.09 

2.90 

2.74 

2.62 
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TABLA  6  (continuacion) 


df\ 


10 

12 

15 

20 

24 

30 

40 

60 

120 

00 

a 

df2 

1.76 

1.71 

1.66 

1.61 

1.57 

1.54 

1.51 

1.47 

1.42 

1.38 

.100 

40 

2.08 

2.00 

1.92 

1.84 

1.79 

1.74 

1.69 

1.64 

1.58 

1.51 

.050 

2.39 

2.29 

2.18 

2.07 

2.01 

1.94 

1.88 

1.80 

1.72 

1.64 

.025 

2.80 

2.66 

2.52 

2.37 

2.29 

2.20 

2.11 

2.02 

1.92 

1.80 

.010 

3.12 

2.95 

2.78 

2.60 

2.50 

2.40 

2.30 

2.18 

2.06 

1.93 

.005 

1.71 

1.66 

1.60 

1.54 

1.51 

1.48 

1.44 

1.40 

1.35 

1.29 

.100 

60 

1.99 

1.92 

1.84 

1.75 

1.70 

1.65 

1.59 

1.53 

1.47 

1.39 

.050 

2.27 

2.17 

2.06 

1.94 

1.88 

1.82 

1.74 

1.67 

1.58 

1.48 

.025 

2.63 

2.50 

2.35 

2.20 

2.12 

2.03 

1.94 

1.84 

1.73 

1.60 

.010 

2.90 

2.74 

2.57 

2.39 

2.29 

2.19 

2.08 

1.96 

1.83 

1.69 

.005 

1.65 

1.60 

1.55 

1.48 

1.45 

1.41 

1.37 

1.32 

1.26 

1.19 

.100 

120 

1.91 

1.83 

1.75 

1.66 

1.61 

1.55 

1.50 

1.43 

1.35 

1.25 

.050 

2.16 

2.05 

1.94 

1.82 

1.76 

1.69 

1.61 

1.53 

1.43 

1.31 

.025 

2.47 

2.34 

2.19 

2.03 

1.95 

1.86 

1.76 

1.66 

1.53 

1.38 

.010 

2.71 

2.54 

2.37 

2.19 

2.09 

1.98 

1.87 

1.75 

1.61 

1.43 

.005 

1.60 

1.55 

1.49 

1.42 

1.38 

1.34 

1.30 

1.24 

1.17 

1.00 

.100 

00 

1.83 

1.75 

1.67 

1.57 

1.52 

1.46 

1.39 

1.32 

1.22 

1.00 

.050 

2.05 

1.94 

1.83 

1.71 

1.64 

1.57 

1.48 

1.39 

1.27 

1.00 

.025 

2.32 

2.18 

2.04 

1.88 

1.79 

1.70 

1.59 

1.47 

1.32 

1.00 

.010 

2.52 

2.36 

2.19 

2.00 

1.90 

1.79 

1.67 

1.53 

1.36 

1.00 

.005 

www.FreeLibros.me 


702  O  APENDICE I  TABLAS 


TABLA  7 a} 

Valores  crfticos 
de  cola  izquierda 
a  5% 


TABLA  7  Valores  cri'ticos  de  T  para  la  prueba  de  suma  de  rango 
de  Wilcoxon,  £  n2 


n2 

Mi 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

3 

_ 

6 

4 

— 

6 

11 

5 

3 

7 

12 

19 

6 

3 

8 

13 

20 

28 

7 

3 

8 

14 

21 

29 

39 

8 

4 

9 

15 

23 

31 

41 

51 

9 

4 

10 

16 

24 

33 

43 

54 

66 

10 

4 

10 

17 

26 

35 

45 

56 

69 

82 

11 

4 

11 

18 

27 

37 

47 

59 

72 

86 

100 

12 

5 

1 1 

19 

28 

38 

49 

62 

75 

89 

104 

120 

13 

5 

12 

20 

30 

40 

52 

64 

78 

92 

108 

125 

142 

14 

6 

13 

21 

31 

42 

54 

67 

81 

96 

112 

129 

147 

166 

15 

6 

13 

22 

33 

44 

56 

69 

84 

99 

116 

133 

152 

171 

192 

TABLA  7 fa) 

Valores  crfticos 
de  cola  izquierda 
a  2.5% 


n2 

n. 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

4 

_ 

_ 

10 

5 

— 

6 

1 1 

17 

6 

— 

7 

12 

18 

26 

7 

— 

7 

13 

20 

27 

36 

8 

3 

8 

14 

21 

29 

38 

49 

9 

3 

8 

14 

22 

31 

40 

51 

62 

10 

3 

9 

15 

23 

32 

42 

53 

65 

78 

1 1 

3 

9 

16 

24 

34 

44 

55 

68 

81 

96 

12 

4 

10 

17 

26 

35 

46 

58 

71 

84 

99 

115 

13 

4 

10 

18 

27 

37 

48 

60 

73 

88 

103 

119 

136 

14 

4 

11 

19 

28 

38 

50 

62 

76 

91 

106 

123 

141 

160 

15 

4 

11 

20 

29 

40 

52 

65 

79 

94 

110 

127 

145 

164 

184 

Fuente:  Datos  de  "An  Extended  Table  of  Critical  Values  for  the  Mann-Whitney  (Wilcoxon)  Two-Sample 
Statistic"  por  Roy  C.  Milton,  pp.  925-934  en  la  Journal  of  the  American  Statistical  Association,  vol.  59, 
num.  307,  septiembre  de  1 964.  Reimpresa  con  permiso  de  la  Journal  of  the  American  Statistical  Associa¬ 
tion.  Copyright  1964  por  la  American  Statistical  Association.  Todos  los  derechos  reservados. 
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TABLA  7c) 

Valores  crfticos 
de  cola  izquierda 
a  1% 


n i 

n2 

2 

3 

4 

5 

6 

7 

8  9 

10 

11 

12 

13 

14 

15 

3 

4 


5 

— 

— 

10 

16 

6 

— 

— 

11 

17 

24 

7 

— 

6 

1 1 

18 

25 

34 

8 

— 

6 

12 

19 

27 

35 

45 

9 

— 

7 

13 

20 

28 

37 

47 

59 

10 

— 

7 

13 

21 

29 

39 

49 

61 

74 

11 

— 

7 

14 

22 

30 

40 

51 

63 

77 

91 

12 

— 

8 

15 

23 

32 

42 

53 

66 

79 

94 

109 

13 

3 

8 

15 

24 

33 

44 

56 

68 

82 

97 

113 

130 

14 

3 

8 

16 

25 

34 

45 

58 

71 

85 

100 

116 

134 

152 

15 

3 

9 

17 

26 

36 

47 

60 

73 

88 

103 

120 

138 

156 

1 76 

TABLA  7 cf) 

Valores  crfticos 
de  cola  izquierda 
a  .5% 


n2 

Ol 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

15 

3 

— 

5 

_ 

_ 

15 

6 

— 

10 

16 

23 

7 

— 

10 

16 

24 

32 

8 

— 

11 

17 

25 

34 

42 

9 

6 

11 

18 

26 

35 

45 

56 

10 

6 

12 

19 

27 

37 

47 

58 

71 

1 1 

6 

12 

20 

28 

38 

49 

61 

73 

87 

12 

7 

13 

21 

30 

40 

51 

63 

76 

90 

105 

13 

7 

13 

22 

31 

41 

53 

65 

79 

93 

109 

125 

14 

7 

14 

22 

32 

43 

54 

67 

81 

96 

112 

129 

147 

15 

8 

15 

23 

33 

44 

56 

69 

84 

99 

115 

133 

151 

171 
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TABLA  8 

Una  cola 

Dos  colas 

n  =  5 

n  =  6 

n  =  7 

n  =  8 

n  =  9 

n  =  10 

T  para  la  prueba 

a  =  .050 

a  =  .10 

1 

2 

4 

6 

8 

11 

de  rango  con 

a  =  .025 

a  =  .05 

1 

2 

4 

6 

8 

signo  de  Wilcoxon, 

a  =  .010 

a  =  .02 

0 

2 

3 

5 

n  =  5(1)50 

a  =  .005 

a  =  .01 

0 

2 

3 

Una  cola 

Dos  colas 

n  =  11 

n  =  12 

n  =  13 

n  =  14 

n  =  15 

n  =  16 

a  =  .050 

a  =  .10 

14 

17 

21 

26 

30 

36 

a  =  .025 

a  =  .05 

11 

14 

17 

21 

25 

30 

a  =  .010 

a  =  .02 

7 

10 

13 

16 

20 

24 

a  =  .005 

a  =  .01 

5 

7 

10 

13 

16 

19 

Una  cola 

Dos  colas 

n  =  17 

n  =  18 

n  =  19 

n  =  20 

n  =  21 

n  =  22 

a  =  .050 

a  =  .10 

41 

47 

54 

60 

68 

75 

a  =  .025 

a  =  .05 

35 

40 

46 

52 

59 

66 

a  =  .010 

a  =  .02 

28 

33 

38 

43 

49 

56 

a  =  .005 

a  =  .01 

23 

28 

32 

37 

43 

49 

Una  cola 

Dos  colas 

r  =  23 

n  =  24 

n  =  25 

n  =  26 

n  =  27 

n  =  28 

a  =  .050 

a  =  .10 

83 

92 

101 

110 

120 

130 

a  =  .025 

a  =  .05 

73 

81 

90 

98 

107 

117 

a  =  .010 

a  =  .02 

62 

69 

77 

85 

93 

102 

a  =  .005 

a  =  .01 

55 

68 

68 

76 

84 

92 

Una  cola 

Dos  colas 

r  =  29 

n  =  30 

n  =  31 

n  =  32 

n  =  33 

n  =  34 

a  =  .050 

a  =  .10 

141 

152 

163 

175 

188 

201 

a  =  .025 

a  =  .05 

127 

137 

148 

159 

171 

183 

a  =  .010 

a  =  .02 

111 

120 

130 

141 

151 

162 

a  =  .005 

a  =  .01 

100 

109 

118 

128 

138 

149 

Una  cola 

Dos  colas 

n  =  35 

n  =  36 

n  =  37 

n  =  38 

n  =  39 

a  =  .050 

a  =  .10 

214 

228 

242 

256 

271 

a  =  .025 

a  =  .05 

195 

208 

222 

235 

250 

a  =  .010 

a  =  .02 

174 

186 

198 

211 

224 

a  =  .005 

a  =  .01 

160 

171 

183 

195 

208 

Una  cola 

Dos  colas 

n  =  40 

n  =  41 

n  =  42 

n  =  43 

n  =  44 

n  =  45 

a  =  .050 

a  =  .10 

287 

303 

319 

336 

353 

371 

a  =  .025 

a  =  .05 

264 

279 

295 

311 

327 

344 

a  =  .010 

a  =  .02 

238 

252 

267 

281 

297 

313 

a  =  .005 

a  =  .01 

221 

234 

248 

262 

277 

292 

Una  cola 

Dos  colas 

n  =  46 

n  =  47 

n  =  48 

n  =  49 

n  =  50 

a  =  .050 

a  =  .10 

389 

408 

427 

446 

466 

a  =  .025 

a  =  .05 

361 

379 

397 

415 

434 

a  =  .010 

a  =  .02 

329 

345 

362 

380 

398 

a  =  .005 

a  =  .01 

307 

323 

339 

356 

373 

Fueihe:  De  "Some  Rapid  Approximate  Statistical  Procedures"  (1964)  28,  por  F.  Wilcoxon  y  R.A.  Wilcox. 
Reproducida  con  el  bondadoso  permiso  de  Lederle  Laboratories,  division  de  American  Cyanamid  Company. 
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TABLA  9 

Valores  crfticos 
del  coeficiente  de 
correlacion 
de  rango  de 
Spearman  para 
una  prueba 
de  una  cola 


n 

a  —  .05 

a  =  .025 

a  =  .01 

a  =  .005 

5 

.900 

— 

— 

— 

6 

.829 

.886 

.943 

— 

7 

.714 

.786 

.893 

— 

8 

.643 

.738 

.833 

.881 

9 

.600 

.683 

.783 

.833 

10 

.564 

.648 

.745 

.794 

1 1 

.523 

.623 

.736 

.818 

12 

.497 

.591 

.703 

.780 

13 

.475 

.566 

.673 

.745 

14 

.457 

.545 

.646 

.716 

15 

.441 

.525 

.623 

.689 

16 

.425 

.507 

.601 

.666 

17 

.412 

.490 

.582 

.645 

18 

.399 

.476 

.564 

.625 

19 

.388 

.462 

.549 

.608 

20 

.377 

.450 

.534 

.591 

21 

.368 

.438 

.521 

.576 

22 

.359 

.428 

.508 

.562 

23 

.351 

.418 

.496 

.549 

24 

.343 

.409 

.485 

.537 

25 

.336 

.400 

.475 

.526 

26 

.329 

.392 

.465 

.515 

27 

.323 

.385 

.456 

.505 

28 

.317 

.377 

.448 

.496 

29 

.311 

.370 

.440 

.487 

30 

.305 

.364 

.432 

.478 

Fuente:  De  "Distribution  of  Sums  of  Squares  of  Rank  Differences  for  Small  Samples"  por  E.G.  Olds,  Annals 
of  Mathematical  Statistics  9  (1938).  Reproducida  con  el  permiso  del  editor,  Annals  of  Mathematical 
Statistics. 
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TABLA  10  Numeros  aleatorios 


Columna 


Renglon 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

1 

10480 

15011 

01536 

02011 

81647 

91646 

69179 

14194 

62590 

36207 

20969 

99570 

91291 

90700 

2 

22368 

46573 

25595 

85393 

30995 

89198 

27982 

53402 

93965 

34095 

52666 

19174 

39615 

99505 

3 

24130 

48360 

22527 

97265 

76393 

64809 

15179 

24830 

49340 

32081 

30680 

19655 

63348 

58629 

4 

42167 

93093 

06243 

61680 

07856 

16376 

39440 

53537 

71341 

57004 

00849 

74917 

97758 

16379 

5 

37570 

39975 

81837 

16656 

06121 

91782 

60468 

81305 

49684 

60672 

14110 

06927 

01263 

54613 

6 

77921 

06907 

11008 

42751 

27756 

53498 

18602 

70659 

90655 

15053 

21916 

81825 

44394 

42880 

7 

99562 

72905 

56420 

69994 

98872 

31016 

71194 

18738 

44013 

48840 

63213 

21069 

10634 

12952 

8 

96301 

91977 

05463 

07972 

18876 

20922 

94595 

56869 

69014 

60045 

18425 

84903 

42508 

32307 

9 

89579 

14342 

63661 

10281 

17453 

18103 

57740 

84378 

25331 

12566 

58678 

44947 

05585 

56941 

10 

84575 

36857 

53342 

53988 

53060 

59533 

38867 

62300 

08158 

17983 

16439 

11458 

18593 

64952 

11 

28918 

69578 

88231 

33276 

70997 

79936 

56865 

05859 

90106 

31595 

01547 

85590 

91610 

78188 

12 

63553 

40961 

48235 

03427 

49626 

69445 

18663 

72695 

52180 

20847 

12234 

90511 

33703 

90322 

13 

09429 

93969 

52636 

92737 

88974 

33488 

36320 

17617 

30015 

08272 

84115 

27156 

30613 

74952 

14 

10365 

61129 

87529 

85689 

48237 

52267 

67689 

93394 

01511 

26358 

85104 

20285 

29975 

89868 

15 

07119 

97336 

71048 

08178 

77233 

13916 

47564 

81056 

97735 

85977 

29372 

74461 

28551 

90707 

16 

51085 

12765 

51821 

51259 

77452 

16308 

60756 

92144 

49442 

53900 

70960 

63990 

75601 

40719 

17 

02368 

21382 

52404 

60268 

89368 

19885 

55322 

44819 

01188 

65255 

64835 

44919 

05944 

55157 

18 

01011 

54092 

33362 

94904 

31273 

04146 

18594 

29852 

71585 

85030 

51132 

01915 

92747 

64951 

19 

52162 

53916 

46369 

58586 

23216 

14513 

83149 

98736 

23495 

64350 

94738 

17752 

35156 

35749 

20 

07056 

97628 

33787 

09998 

42698 

06691 

76988 

13602 

51851 

46104 

88916 

19509 

25625 

58104 

21 

48663 

91245 

85828 

14346 

09172 

30168 

90229 

04734 

59193 

22178 

30421 

61666 

99904 

32812 

22 

54164 

58492 

22421 

74103 

47070 

25306 

76468 

26384 

58151 

06646 

21524 

15227 

96909 

44592 

23 

32639 

32363 

05597 

24200 

13363 

38005 

94342 

28728 

35806 

06912 

17012 

64161 

18296 

22851 

24 

29334 

27001 

87637 

87308 

58731 

00256 

45834 

15398 

46557 

41135 

10367 

07684 

36188 

18510 

25 

02488 

33062 

28834 

07351 

19731 

92420 

60952 

61280 

50001 

67658 

32586 

86679 

50720 

94953 

26 

81525 

72295 

04839 

96423 

24878 

82651 

66566 

14778 

76797 

14780 

13300 

87074 

79666 

95725 

27 

29676 

20591 

68086 

26432 

46901 

20849 

89768 

81536 

86645 

12659 

92259 

57102 

80428 

25280 

28 

00742 

57392 

39064 

66432 

84673 

40027 

32832 

61362 

98947 

96067 

64760 

64585 

96096 

98253 

29 

05366 

04213 

25669 

26422 

44407 

44048 

37937 

63904 

45766 

66134 

75470 

66520 

34693 

90449 

30 

91921 

26418 

64117 

94305 

26766 

25940 

39972 

22209 

71500 

64568 

91402 

42416 

07844 

69618 

31 

00582 

04711 

87917 

77341 

42206 

35126 

74087 

99547 

81817 

42607 

43808 

76655 

62028 

76630 

32 

00725 

69884 

62797 

56170 

86324 

88072 

76222 

36086 

84637 

93161 

76038 

65855 

77919 

88006 

33 

69011 

65795 

95876 

55293 

18988 

27354 

26575 

08625 

40801 

59920 

29841 

80150 

12777 

48501 

34 

25976 

57948 

29888 

88604 

67917 

48708 

18912 

82271 

65424 

69774 

3361  1 

54262 

85963 

03547 

35 

09763 

83473 

73577 

12908 

30883 

18317 

28290 

35797 

05998 

41688 

34952 

37888 

38917 

88050 

36 

91567 

42595 

27958 

30134 

04024 

86385 

29880 

99730 

55536 

84855 

29080 

09250 

79656 

73211 

37 

17955 

56349 

90999 

49127 

20044 

59931 

06115 

20542 

18059 

02008 

73708 

83517 

36103 

42791 

38 

46503 

18584 

18845 

49618 

02304 

51038 

20655 

58727 

28168 

15475 

56942 

53389 

20562 

87338 

39 

92157 

89634 

94824 

78171 

84610 

82834 

09922 

25417 

44137 

48413 

25555 

21246 

35509 

20468 

40 

14577 

62765 

35605 

81263 

39667 

47358 

56873 

56307 

61607 

49518 

89656 

20103 

77490 

18062 

41 

98427 

07523 

33362 

64270 

01638 

92477 

66969 

98420 

04880 

45585 

46565 

04102 

46880 

45709 

42 

34914 

63976 

88720 

82765 

34476 

17032 

87589 

40836 

32427 

70002 

70663 

88863 

77775 

69348 

43 

70060 

28277 

39475 

46473 

23219 

53416 

94970 

25832 

69975 

94884 

19661 

72828 

00102 

66794 

44 

53976 

54914 

06990 

67245 

68350 

82948 

11398 

42878 

80287 

88267 

47363 

46634 

06541 

97809 

45 

76072 

29515 

40980 

07391 

58745 

25774 

22987 

80059 

39911 

96189 

41151 

14222 

60697 

59583 

46 

90725 

52210 

83974 

29992 

65831 

38857 

50490 

83765 

55657 

14361 

31720 

57375 

56228 

41546 

47 

64364 

67412 

33339 

31926 

14883 

24413 

59744 

92351 

97473 

89286 

35931 

04110 

23726 

51900 

48 

08962 

00358 

31662 

25388 

61642 

34072 

81249 

35648 

56891 

69352 

48373 

45578 

78547 

81788 

49 

95012 

68379 

93526 

70765 

10592 

04542 

76463 

54328 

02349 

17247 

28865 

14777 

62730 

92277 

50 

15664 

10493 

20492 

38391 

91132 

21999 

59516 

81652 

27195 

48223 

46751 

22923 

32261 

85653 

Fubnte:  De  Handbook  of  Tables  for  Probabiliy  and  Statistics,  2a.  ed.,  por  William  H.  Beyer  (CRC  Press).  Usada  con  permiso  de  William  H.  Beyer. 
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TABLA  10  (continuacidn) 


Columna 


Renglon 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

13 

14 

51 

16408 

81899 

04153 

53381 

79401 

21438 

83035 

92350 

36693 

31238 

59649 

91754 

72772 

02338 

52 

18629 

81953 

05520 

91962 

04739 

13092 

97662 

24822 

94730 

06496 

35090 

04822 

86774 

98289 

53 

73115 

35101 

47498 

87637 

99016 

71060 

88824 

71013 

18735 

20286 

23153 

72924 

35165 

43040 

54 

57491 

16703 

23167 

49323 

45021 

33132 

12544 

41035 

80780 

45393 

44812 

12515 

98931 

91202 

55 

30405 

83946 

23792 

14422 

15059 

45799 

22716 

19792 

09983 

74353 

68668 

30429 

70735 

25499 

56 

16631 

35006 

85900 

98275 

32388 

52390 

16815 

69298 

82732 

38480 

73817 

32523 

41961 

44437 

57 

96773 

20206 

42559 

78985 

05300 

22164 

24369 

54224 

35033 

19687 

11052 

91491 

60383 

19746 

58 

38935 

64202 

14349 

82674 

66523 

44133 

00697 

35552 

35970 

19124 

63318 

29686 

03387 

59846 

59 

31624 

76384 

17403 

53363 

44167 

64486 

64758 

75366 

76554 

31601 

12614 

33072 

60332 

92325 

60 

78919 

19474 

23632 

27889 

47914 

02584 

37680 

20801 

72152 

39339 

34806 

08930 

85001 

87820 

61 

03931 

33309 

57047 

74211 

63445 

17361 

62825 

39908 

05607 

91284 

68833 

25570 

38818 

46920 

62 

74426 

33278 

43972 

10119 

89917 

15665 

52872 

73823 

73144 

88662 

88970 

74492 

51805 

99378 

63 

09066 

00903 

20795 

95452 

92648 

45454 

09552 

88815 

16553 

51125 

79375 

97596 

16296 

66092 

64 

42238 

12426 

87025 

14267 

20979 

04508 

64535 

31355 

86064 

29472 

47689 

05974 

52468 

16834 

65 

16153 

08002 

26504 

41744 

81959 

65642 

74240 

56302 

00033 

67107 

77510 

70625 

28725 

34191 

66 

21457 

40742 

29820 

96783 

29400 

21840 

15035 

34537 

33310 

06116 

95240 

15957 

16572 

06004 

67 

21581 

57802 

02050 

89728 

17937 

37621 

47075 

42080 

97403 

48626 

68995 

43805 

33386 

21597 

68 

55612 

78095 

83197 

33732 

05810 

24813 

86902 

60397 

16489 

03264 

88525 

42786 

05269 

92532 

69 

44657 

66999 

99324 

51281 

84463 

60563 

79312 

93454 

68876 

25471 

9391 1 

25650 

12682 

73572 

70 

91340 

84979 

46949 

81973 

37949 

61023 

43997 

15263 

80644 

43942 

89203 

71795 

99533 

50501 

71 

91227 

21199 

31935 

27022 

84067 

05462 

35216 

14486 

29891 

68607 

41867 

14951 

91696 

85065 

72 

50001 

38140 

66321 

19924 

72163 

09538 

12151 

06878 

91903 

18749 

34405 

56087 

82790 

70925 

73 

65390 

05224 

72958 

28609 

81406 

39147 

25549 

48542 

42627 

45233 

57202 

94617 

23772 

07896 

74 

27504 

96131 

83944 

41575 

10573 

08619 

64482 

73923 

36152 

05184 

94142 

25299 

84387 

34925 

75 

37169 

94851 

39117 

89632 

00959 

16487 

65536 

49071 

39782 

17095 

02330 

74301 

00275 

48280 

76 

11508 

70225 

51111 

38351 

19444 

66499 

71945 

05422 

13442 

78675 

84081 

66938 

93654 

59894 

77 

37449 

30362 

06694 

54690 

04052 

53115 

62757 

95348 

78662 

11163 

81651 

50245 

34971 

52924 

78 

46515 

70331 

85922 

38329 

57015 

15765 

97161 

17869 

45349 

61796 

66345 

81073 

49106 

79860 

79 

30986 

81223 

42416 

58353 

21532 

30502 

32305 

86482 

05174 

07901 

54339 

58861 

74818 

46942 

80 

63798 

64995 

46583 

09785 

44160 

78128 

83991 

42865 

92520 

83531 

80377 

35909 

81250 

54238 

81 

82486 

84846 

99254 

67632 

43218 

50076 

21361 

64816 

51202 

88124 

41870 

52689 

51275 

83556 

82 

21885 

32906 

92431 

09060 

64297 

51674 

64126 

62570 

26123 

05155 

59194 

52799 

28225 

85762 

83 

60336 

98782 

07408 

53458 

13564 

59089 

26445 

29789 

85205 

41001 

12535 

12133 

14645 

23541 

84 

43937 

46891 

24010 

25560 

86355 

33941 

25786 

54990 

71899 

15475 

95434 

98227 

21824 

19585 

85 

97656 

63175 

89303 

16275 

07100 

92063 

21942 

18611 

47348 

20203 

18534 

03862 

78095 

50136 

86 

03299 

01221 

05418 

38982 

55758 

92237 

26759 

86367 

21216 

98442 

08303 

56613 

91511 

75928 

87 

79626 

06486 

03574 

17668 

07785 

76020 

79924 

25651 

83325 

88428 

85076 

72811 

22717 

50585 

88 

85636 

68335 

47539 

03129 

65651 

11977 

02510 

26113 

99447 

68645 

34327 

15152 

55230 

93448 

89 

18039 

14367 

61337 

06177 

12143 

46609 

32989 

74014 

64708 

00533 

35398 

58408 

13261 

47908 

90 

08362 

15656 

60627 

36478 

65648 

16764 

53412 

09013 

07832 

41574 

17639 

82163 

60859 

75567 

91 

79556 

29068 

04142 

16268 

15387 

12856 

66227 

38358 

22478 

73373 

88732 

09443 

82558 

05250 

92 

92608 

82674 

27072 

32534 

17075 

27698 

98204 

63863 

11951 

34648 

88022 

56148 

34925 

57031 

93 

23982 

25835 

40055 

67006 

12293 

02753 

14827 

23235 

35071 

99704 

37543 

11601 

35503 

85171 

94 

09915 

96306 

05908 

97901 

28395 

14186 

00821 

80703 

70426 

75647 

76310 

88717 

37890 

40129 

95 

59037 

33300 

26695 

62247 

69927 

76123 

50842 

43834 

86654 

70959 

79725 

93872 

28117 

19233 

96 

42488 

78077 

69882 

61657 

34136 

79180 

97526 

43092 

04098 

73571 

80799 

76536 

71255 

64239 

97 

46764 

86273 

63003 

93017 

31204 

36692 

40202 

35275 

57306 

55543 

53203 

18098 

47625 

88684 

98 

03237 

45430 

55417 

63282 

90816 

17349 

88298 

90183 

36600 

78406 

06216 

95787 

42579 

90730 

99 

86591 

81482 

52667 

61582 

14972 

90053 

89534 

76036 

49199 

43716 

97548 

04379 

46370 

28672 

100 

38534 

01715 

94964 

87288 

65680 

43772 

39560 

12918 

86737 

62738 

19636 

51132 

25739 

56947 

www.FreeLibros.me 


708  O  APENDICE I  TABLAS 


TABLA  11a) 

Puntos 
porcentuales  del 
rango  de  Student, 
q.os(k,  df)-  puntos 
de  5%  superior 


tabla  11  Puntos  porcentuales  del  rango  de  Student,  q.05(k,  df) 


k 


df 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

1 

17.97 

26.98 

32.82 

37.08 

40.41 

43.12 

45.40 

47.36 

49.07 

50.59 

2 

6.08 

8.33 

9.80 

10.88 

11.74 

12.44 

13.03 

13.54 

13.99 

14.39 

3 

4.50 

5.91 

6.82 

7.50 

8.04 

8.48 

8.85 

9.18 

9.46 

9.72 

4 

3.93 

5.04 

5.76 

6.29 

6.71 

7.05 

7.35 

7.60 

7.83 

8.03 

5 

3.64 

4.60 

5.22 

5.67 

6.03 

6.33 

6.58 

6.80 

6.99 

7.17 

6 

3.46 

4.34 

4.90 

5.30 

5.63 

5.90 

6.12 

6.32 

6.49 

6.65 

7 

3.34 

4.16 

4.68 

5.06 

5.36 

5.61 

5.82 

6.00 

6.16 

6.30 

8 

3.26 

4.04 

4.53 

4.89 

5.17 

5.40 

5.60 

5.77 

5.92 

6.05 

9 

3.20 

3.95 

4.41 

4.76 

5.02 

5.24 

5.43 

5.59 

5.74 

5.87 

10 

3.15 

3.88 

4.33 

4.65 

4.91 

5.12 

5.30 

5.46 

5.60 

5.72 

11 

3.11 

3.82 

4.26 

4.57 

4.82 

5.03 

5.20 

5.35 

5.49 

5.61 

12 

3.08 

3.77 

4.20 

4.51 

4.75 

4.95 

5.12 

5.27 

5.39 

5.51 

13 

3.06 

3.73 

4.15 

4.45 

4.69 

4.88 

5.05 

5.19 

5.32 

5.43 

14 

3.03 

3.70 

4.11 

4.41 

4.64 

4.83 

4.99 

5.13 

5.25 

5.36 

15 

3.01 

3.67 

4.08 

4.37 

4.60 

4.78 

4.94 

5.08 

5.20 

5.31 

16 

3.00 

3.65 

4.05 

4.33 

4.56 

4.74 

4.90 

5.03 

5.15 

5.26 

17 

2.98 

3.63 

4.02 

4.30 

4.52 

4.70 

4.86 

4.99 

5.11 

5.21 

18 

2.97 

3.61 

4.00 

4.28 

4.49 

4.67 

4.82 

4.96 

5.07 

5.17 

19 

2.96 

3.59 

3.98 

4.25 

4.47 

4.65 

4.79 

4.92 

5.04 

5.14 

20 

2.95 

3.58 

3.96 

4.23 

4.45 

4.62 

4.77 

4.90 

5.01 

5.1 1 

24 

2.92 

3.53 

3.90 

4.17 

4.37 

4.54 

4.68 

4.81 

4.92 

5.01 

30 

2.89 

3.49 

3.85 

4.10 

4.30 

4.46 

4.60 

4.72 

4.82 

4.92 

40 

2.86 

3.44 

3.79 

4.04 

4.23 

4.39 

4.52 

4.63 

4.73 

4.82 

60 

2.83 

3.40 

3.74 

3.98 

4.16 

4.31 

4.44 

4.55 

4.65 

4.73 

120 

2.80 

3.36 

3.68 

3.92 

4.10 

4.24 

4.36 

4.47 

4.56 

4.64 

00 

2.77 

3.31 

3.63 

3.86 

4.03 

4.17 

4.29 

4.39 

4.47 

4.55 
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(continuacion) 


12 

13 

14 

15 

16 

17 

18 

19 

20 

df 

51.96 

53.20 

54.33 

55.36 

56.32 

57.22 

58.04 

58.83 

59.56 

1 

14.75 

15.08 

15.38 

15.65 

15.91 

16.14 

16.37 

16.57 

16.77 

2 

9.95 

10.15 

10.35 

10.52 

10.69 

10.84 

10.98 

11.11 

11.24 

3 

8.21 

8.37 

8.52 

8.66 

8.79 

8.91 

9.03 

9.13 

9.23 

4 

7.32 

7.47 

7.60 

7.72 

7.83 

7.93 

8.03 

8.12 

8.21 

5 

6.79 

6.92 

7.03 

7.14 

7.24 

7.34 

7.43 

7.51 

7.59 

6 

6.43 

6.55 

6.66 

6.76 

6.85 

6.94 

7.02 

7.10 

7.17 

7 

6.18 

6.29 

6.39 

6.48 

6.57 

6.65 

6.73 

6.80 

6.87 

8 

5.98 

6.09 

6.19 

6.28 

6.36 

6.44 

6.51 

6.58 

6.64 

9 

5.83 

5.93 

6.03 

6.11 

6.19 

6.27 

6.34 

6.40 

6.47 

10 

5.71 

5.81 

5.90 

5.98 

6.06 

6.13 

6.20 

6.27 

6.33 

11 

5.61 

5.71 

5.80 

5.88 

5.95 

6.02 

6.09 

6.15 

6.21 

12 

5.53 

5.63 

5.71 

5.79 

5.86 

5.93 

5.99 

6.05 

6.11 

13 

5.46 

5.55 

5.64 

5.71 

5.79 

5.85 

5.91 

5.97 

6.03 

14 

5.40 

5.49 

5.57 

5.65 

5.72 

5.78 

5.85 

5.90 

5.96 

15 

5.35 

5.44 

5.52 

5.59 

5.66 

5.73 

5.79 

5.84 

5.90 

16 

5.31 

5.39 

5.47 

5.54 

5.61 

5.67 

5.73 

5.79 

5.84 

17 

5.27 

5.35 

5.43 

5.50 

5.57 

5.63 

5.69 

5.74 

5.79 

18 

5.23 

5.31 

5.39 

5.46 

5.53 

5.59 

5.65 

5.70 

5.75 

19 

5.20 

5.28 

5.36 

5.43 

5.49 

5.55 

5.61 

5.66 

5.71 

20 

5.10 

5.18 

5.25 

5.32 

5.38 

5.44 

5.49 

5.55 

5.59 

24 

5.00 

5.08 

5.15 

5.21 

5.27 

5.33 

5.38 

5.43 

5.47 

30 

4.90 

4.98 

5.04 

5.11 

5.16 

5.22 

5.27 

5.31 

5.36 

40 

4.81 

4.88 

4.94 

5.00 

5.06 

5.11 

5.15 

5.20 

5.24 

60 

4.71 

4.78 

4.84 

4.90 

4.95 

5.00 

5.04 

5.09 

5.13 

120 

4.62 

4.68 

4.74 

4.80 

4.85 

4.89 

4.93 

4.97 

5.01 

OO 

Fuentc:  De  Biometrika  Tables  for  Statisticians,  vol.  1,  3a.  ed.,  por  E.S.  Pearson  y  H.O.  Hartley 
(Cambridge  University  Press,  1966).  Reproducida  con  permiso  de  los  fideicomisarios  de  Biometrika. 
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TABLA  11b) 

Puntos 
porcentuales  del 
rango  de  Student, 
q.oAk,  df)\  puntos 

k 

df 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

1 

90.03 

135.0 

164.3 

185.6 

202.2 

215.8 

227.2 

237.0 

245.6 

253.2 

de  1  %  superior 

2 

14.04 

19.02 

22.29 

24.72 

26.63 

28.20 

29.53 

30.68 

31.69 

32.59 

3 

8.26 

10.62 

12.17 

13.33 

14.24 

15.00 

15.64 

16.20 

16.69 

17.13 

4 

6.51 

8.12 

9.17 

9.96 

10.58 

11.10 

11.55 

1 1.93 

12.27 

12.57 

5 

5.70 

6.98 

7.80 

8.42 

8.91 

9.32 

9.67 

9.97 

10.24 

10.48 

6 

5.24 

6.33 

7.03 

7.56 

7.97 

8.32 

8.61 

8.87 

9.10 

9.30 

7 

4.95 

5.92 

6.54 

7.01 

7.37 

7.68 

7.94 

8.17 

8.37 

8.55 

8 

4.75 

5.64 

6.20 

6.62 

6.96 

7.24 

7.47 

7.68 

7.86 

8.03 

9 

4.60 

5.43 

5.96 

6.35 

6.66 

6.91 

7.13 

7.33 

7.49 

7.65 

10 

4.48 

5.27 

5.77 

6.14 

6.43 

6.67 

6.87 

7.05 

7.21 

7.36 

11 

4.39 

5.15 

5.62 

5.97 

6.25 

6.48 

6.67 

6.84 

6.99 

7.13 

12 

4.32 

5.05 

5.50 

5.84 

6.10 

6.32 

6.51 

6.67 

6.81 

6.94 

13 

4.26 

4.96 

5.40 

5.73 

5.98 

6.19 

6.37 

6.53 

6.67 

6.79 

14 

4.21 

4.89 

5.32 

5.63 

5.88 

6.08 

6.26 

6.41 

6.54 

6.66 

15 

4.17 

4.84 

5.25 

5.56 

5.80 

5.99 

6.16 

6.31 

6.44 

6.55 

16 

4.13 

4.79 

5.19 

5.49 

5.72 

5.92 

6.08 

6.22 

6.35 

6.46 

17 

4.10 

4.74 

5.14 

5.43 

5.66 

5.85 

6.01 

6.15 

6.27 

6.38 

18 

4.07 

4.70 

5.09 

5.38 

5.60 

5.79 

5.94 

6.08 

6.20 

6.31 

19 

4.05 

4.67 

5.05 

5.33 

5.55 

5.73 

5.89 

6.02 

6.14 

6.25 

20 

4.02 

4.64 

5.02 

5.29 

5.51 

5.69 

5.84 

5.97 

6.09 

6.19 

24 

3.96 

4.55 

4.91 

5.17 

5.37 

5.54 

5.69 

5.81 

5.92 

6.02 

30 

3.89 

4.45 

4.80 

5.05 

5.24 

5.40 

5.54 

5.65 

5.76 

5.85 

40 

3.82 

4.37 

4.70 

4.93 

5.11 

5.26 

5.39 

5.50 

5.60 

5.69 

60 

3.76 

4.28 

4.59 

4.82 

4.99 

5.13 

5.25 

5.36 

5.45 

5.53 

120 

3.70 

4.20 

4.50 

4.71 

4.87 

5.01 

5.12 

5.21 

5.30 

5.37 

00 

3.64 

4.12 

4.40 

4.60 

4.76 

4.88 

4.99 

5.08 

5.16 

5.23 
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TABLA  11b) 

(continuacion) 


12 

13 

14 

15 

16 

17 

18 

19 

20 

df 

260.0 

266.2 

271.8 

277.0 

281.8 

286.3 

290.0 

294.3 

298.0 

1 

33.40 

34.13 

34.81 

35.43 

36.00 

36.53 

37.03 

37.50 

37.95 

2 

17.53 

17.89 

18.22 

18.52 

18.81 

19.07 

19.32 

19.55 

19.77 

3 

12.84 

13.09 

13.32 

13.53 

13.73 

13.91 

14.08 

14.24 

14.40 

4 

10.70 

10.89 

11.08 

1 1.24 

11.40 

11.55 

11.68 

11.81 

11.93 

5 

9.48 

9.65 

9.81 

9.95 

10.08 

10.21 

10.32 

10.43 

10.54 

6 

8.71 

8.86 

9.00 

9.12 

9.24 

9.35 

9.46 

9.55 

9.65 

7 

8.18 

8.31 

8.44 

8.55 

8.66 

8.76 

8.85 

8.94 

9.03 

8 

7.78 

7.91 

8.03 

8.13 

8.23 

8.33 

8.41 

8.49 

8.57 

9 

7.49 

7.60 

7.71 

7.81 

7.91 

7.99 

8.08 

8.15 

8.23 

10 

7.25 

7.36 

7.46 

7.56 

7.65 

7.73 

7.81 

7.88 

7.95 

11 

7.06 

7.17 

7.26 

7.36 

7.44 

7.52 

7.59 

7.66 

7.73 

12 

6.90 

7.01 

7.10 

7.19 

7.27 

7.35 

7.42 

7.48 

7.55 

13 

6.77 

6.87 

6.96 

7.05 

7.13 

7.20 

7.27 

7.33 

7.39 

14 

6.66 

6.76 

6.84 

6.93 

7.00 

7.07 

7.14 

7.20 

7.26 

15 

6.56 

6.66 

6.74 

6.82 

6.90 

6.97 

7.03 

7.09 

7.15 

16 

6.48 

6.57 

6.66 

6.73 

6.81 

6.87 

6.94 

7.00 

7.05 

17 

6.41 

6.50 

6.58 

6.65 

6.72 

6.79 

6.85 

6.91 

6.97 

18 

6.34 

6.43 

6.51 

6.58 

6.65 

6.72 

6.78 

6.84 

6.89 

19 

6.28 

6.37 

6.45 

6.52 

6.59 

6.65 

6.71 

6.77 

6.82 

20 

6.11 

6.19 

6.26 

6.33 

6.39 

6.45 

6.51 

6.56 

6.61 

24 

5.93 

6.01 

6.08 

6.14 

6.20 

6.26 

6.31 

6.36 

6.41 

30 

5.76 

5.83 

5.90 

5.96 

6.02 

6.07 

6.12 

6.16 

6.21 

40 

5.60 

5.67 

5.73 

5.78 

5.84 

5.89 

5.93 

5.97 

6.01 

60 

5.44 

5.50 

5.56 

5.61 

5.66 

5.71 

5.75 

5.79 

5.83 

120 

5.29 

5.35 

5.40 

5.45 

5.49 

5.54 

5.57 

5.61 

5.65 

00 

Fueihe:  De  Biometrika  Tables  for  Statisticians,  vol.  1,  3a.  ed.,  por  E.S.  Pearson  y  H.O.  Hartley 
(Cambridge  University  Press,  1966).  Reproducida  con  permiso  de  los  fideicomisarios  de  Biometrika. 
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Capitulo  1 

1.1  a.  el  estudiante  b.  el  examen 

c.  el  paciente  d.  la  planta  e.  el  auto 

1.3  a.  discreta  b.  continua  c.  continua 

d.  discreta 

1 .5  a.  vehfculos  b.  tipo  (cualitativa);  marca 
(cualitativa);  colectivo  (cualitativa);  distancia 
(cuantitativa  continua);  antiguedad  (cuantitativa 
continua)  c.  multivariado 

1 .7  La  poblacion  es  el  conjunto  de  preferencias  del 
electorado  para  todos  los  electores  del  estado. 

Las  preferencias  del  electorado  pueden  cambiar 
con  el  tiempo. 

1 .9  a.  calificacion  del  examen  de  lectura;  cuantitativa 

b.  el  estudiante  c.  el  conjunto  de  califi- 
caciones  para  todos  los  estudiantes  sordos 
que  hipoteticamente  podrfan  tomar 

el  examen 

1.11  a.  un  par  de  jeans  b.  el  estado  en  que  los 
jeans  son  producidos;  cualitativa  e.  8/25 
f.  California  g.  Los  tres  estados  producen  casi 
los  mismos  numeros  de  jeans. 

1.13  a.  no;  agregue  una  categorfa  llamada  “Otra” 

1 . 1 5  a.  no  b.  no  del  todo  c.  la  grafica 
de  barras 

1.17  Las  respuestas  pueden  a  variar. 

1.19  a.  ocho  a  diez  intervalos  de  clase 

c.  43/50  d.  33/50  e.  si 
1.21  b.  .30  c.  .70  d.  .30 

e.  relativamente  simetrica;  no 

1 .25  b.  centradas  en  75;  dos  picos  (bimodal) 

c.  Las  calificaciones  se  dividen  en  dos  grupos  de 
acuerdo  a  la  capacidad  del  estudiante. 

1 .27  a.  grafica  de  pastel,  grafica  de  barras 
1 .29  c.  la  grafica  de  Pareto 

1 .31  a.  sesgados  a  la  derecha;  varios  resultados 
atfpicos 


1.33  b.  Stem-and-leaf  of  Ages  N  =  37 


Leaf 

Unit 

=  1.0 

2 

4 

69 

3 

5 

3 

7 

5 

6678 

13 

6 

003344 

(6) 

6 

567778 

18 

7 

0111234 

11 

7 

7889 

7 

8 

013 

4 

8 

58 

2 

9 

00 

relativamente  simetrica  c.  Kennedy, 

Garfield  y  Lincoln  fueron  asesinados. 

1.35  b.  0.05 


1 .37  a.  numero  de  sitios  de  desechos  peligrosos 
(discreta)  b.  sesgada  a  la  derecha 
c.  tamano  del  estado;  cantidad  de  actividad 
industrial 


1.39  a.  sesgadas 

d.  simetricas 
1.41  a.  continuas 
d.  discretas 


b.  simetricas 
e.  sesgadas 
b.  continuas 
e.  discretas 


c.  simetricas 
f.  sesgadas 
c.  discretas 


1.43  7 

8 

9 

10 

11 


8  9 
0  1  7 

01244566688 

1  7  9 

2 


1 .45  c.  sesgada  a  la  derecha 
1.49  a.  no  b.  aprox.  En  forma  de  montfculo 
1.51  a.  sesgada  a  la  derecha  c.  sf;  estados  grandes 
1 .53  a.  El  voto  popular  esta  sesgado  a  la  derecha; 
el  porcentaje  de  votos  es  relativamente  sime- 
trico.  b.  sf  c.  Una  vez  eliminado  el 
tamano  del  estado,  cada  estado  sera  medido 
del  mismo  modo. 

1.55  d.  Las  respuestas  variaran. 

1.57  a.  no 
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1 .59  b.  distribucion  bimodal,  resultados  atfpicos; 
diferentes  sitios  de  hornos  c.  sf 

1.63  a.  Exhibicion  de  tallo  y  hojas:  porcentaje 

Stem-and-leaf  of  Percent  N  =  51 
Leaf  Unit  =  1.0 


1 

0 

8 

3 

1 

00 

3 

1 

5 

1 

44 

10 

1 

66777 

20 

1 

8888889999 

(11) 

2 

00000000011 

20 

2 

233333 

14 

2 

444555 

8 

2 

67 

6 

2 

89 

4 

3 

01 

2 

3 

22 

b.  aprox.  En  forma  de  montfculo 


c.  tres  un  poco  bajos:  Alaska,  Georgia  y  Nueva 
Jersey 

1 .65  Use  una  grafica  de  pastel  o  una  grafica  de  barras. 

1 .67  a.  aprox.  En  forma  de  montfculo 

b.  barra  centrada  en  100.8 

c.  ligeramente  arriba  del  centro 

1 .69  a.  un  poco  en  forma  de  montfculo  b.  .2 
1 .73  a-b.  sesgada  a  la  izquierda  c.  8  y  1 1 

Capi'tulo  2 

2.1  b.  x  =  2;  m  =  1;  modo  =1  c.  sesgadas 
2.3  a.  5.8  b.  5.5  c.  5  y  6 

2.5  a.  ligeramente  sesgada  a  la  derecha 
c.  x  =  1.08;  m  =  1;  modo  =  1 

2.7  2.5  es  un  numero  promedio  calculado 

(o  estimado)  para  todas  las  familias  de  una 
categorfa  particular. 

2.9  La  mediana,  porque  la  distribucion  esta  altamente 
sesgada  a  la  derecha. 

2.1 1  a.  x  =  4.72;  m=  3.50;  modo  =  1 

b.  sesgada  a  la  derecha  c.  sf 

2.13  a.  2.4  b.  2.8  c.  1.673 

2.15  a.  3  b.  2.125  c.  a2  =  1.2679; 

5  =  1.126 

2.17  a.  1.11  b.  s2  =  .19007,  s  =  .436 

c.  R  ~  2.5.v 

2.19  a.  s  ~  1.67  b.  s  =  1.75  c.  no 

d.  sf  e.  no 

2.21  a.  aproximadamente  .68 

b.  aproximadamente  .95 

c.  aproximadamente  .815 

d.  aproximadamente  .16 


2.23  a.  s  ~  .20  b.  x  =  .76;  s  =  .165 

2.25  a.  aproximadamente  .68 

b.  aproximadamente  .95 

c.  aproximadamente  .003 

2.27  a.  «  4.5  b.  »  2.25  c.  x  =  4.586; 
s  =  2.892 


2.29  a.  sesgada  a  la  derecha  b.  0al04dfas 


2.31 

b.  x  =  7.729 

c.  s  = 

=  1.985 

Regia 

k  x  ±  ks 

Actual 

Tchebysheff 

empirica 

1  (5.744,9.714) 

.71 

Al  menos  0 

Aprox.  .68 

2  (3.759,11.699) 

.96 

Al  menos  3/4 

Aprox.  .95 

3  (1.774,13.684) 

1.00 

Al  menos  8/9 

Aprox.  .997 

2.33 

a.  42  b.  s  ~ 

d.  1.00;  1.00;  sf 

=  10.5 

c.  s  =  13.10 

2.35 

a.  s  ~  .444 

b.  s  = 

.436 

2.37 

a-b.  x  =  1.4;  s2 

=  1.4 

2.39 

a.  x  =  2.04;  s  = 

2.806 

b-c. 

Regia 

k  x  ±  ks 

Actual 

Tchebysheff 

empirica 

1  (-.766,4.846) 

.84 

Al  menos  0 

Aprox.  .68 

2  (-3.572,7.652) 

.92 

Al  menos  3/4 

Aprox.  .95 

3  (-6.378,10.458) 

1.00 

Al  menos  8/9 

Aprox.  .997 

2.41 


Conjunto 

ordenado 

de  datos 

Posicion 
de  Q, 

Mediciones 
arriba  y 
abajo 

Q. 

Posicion 
of  Q3 

Mediciones 
arriba  y 
abajo 

q3 

1,1.5,  2, 
2,2.2 

1.5 

1  y  1.5 

1.25 

4.5 

2y 

2.2 

2.1 

0,  1.7,  1.8, 
3.1,  3.2, 

7,  8, 8.8, 

8.9,  9, 

10 

3 

Ninguna 

1.8 

9 

Ninguna 

8.9 

.23,  .30, 

.35,  .41, 

.56,  .58, 

.76,  .80 

2.25 

.30  y 
.35 

.3125 

6.75 

.58  y 
.76 

.7150 

2.43  mm  =  0,  Qi  =  6,  m  =  10,  Q3  =  14, 
max  =  19;  IQR  =  8 

2.45  cuartil  superior  e  inferior:  —2.25  y  15.25; 
x  =  22  es  un  resultado  atfpico 

2.47  a.  mm  =  1.70,  Qi  =  130.5,  m  =  246.5, 

Q3  =  317.5,  max  =  485 

b.  cuartil  superior  e  inferior:  — 150  y  598 

c-d.  No,  pero  hay  cuatro  observaciones  extremada- 

mente  pequenas,  no  identificadas  por  la  grafica  de 

caja  como  resultados  atfpicos. 
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2.49  a.  Variable  Minimum  Q1  Median  Q3  Maximum 

Favre  5.00  19.25  22.00  24.75  31.00 

Manning  14.00  20.25  23.50  26.75  32.00 

b.  Favre:  cuartil  inferior  y  superior:  1 1  y  33;  un 
resultado  atfpico  (x  =  5);  relativamente  simetricas, 
excepto  por  el  resultado  atfpico.  Manning:  cuartil 
superior  e  inferior:  10.5  y  36.5;  no  hay  resultados 
atfpicos,  relativamente  simetricos. 

2.51  a.  sesgada  a  la  izquierda  b.  x  =  108.15; 
m  =  123.5;  media  <  mediana  implica  sesgada 
a  la  izquierda  c.  cuartil  superior  e  inferior: 
—43.125  y  259.875;  sesgada  a  la  izquierda, 
no  hay  resultados  atfpicos. 

2.53  Las  temperaturas  en  mujeres  tienen  un  centra 
(mediana)  mas  alto  y  son  mas  variables;  tres 
resultados  atfpicos  en  el  grupo  de  mujeres. 

2.55  a.  Generica:  m  =  26,  Q3  =  25,  Q3  =  27.25, 

IQR  =  2.25;  Sunmaid:  m  =  26,  Qi  =  24, 

Q3  =  28,  IQR  =  4  b.  Generica:  cuartil  supe¬ 
rior  e  inferior:  21.625  y  30.625;  Sunmaid:  cuartil 
superior  e  inferior:  1 8  y  34  c.  sf 
d.  El  tamano  promedio  es  casi  igual;  los  tamanos 
individuales  de  pasas  son  mas  variables  para  pasas 
Sunmaid. 

2.57  a.  R  =  32.1  b.  s  =  8.025  c.  s  =  7.671 
2.59  m  =  6.35,  Qi  =  2.325,  Q3  =  12.825;  cuartil  infe¬ 
rior  y  superior:  — 13.425  y  28.575;  un  resultado 
atfpico  (x  =  32.3). 

2.61  a,  b. 

k  x  ±  ks  Tchebysheff  Regia  empirica 

1  (.16,  .18)  Al  menos  0  Aprox.  .68 

2  (.15,  .19)  Almenos3/4  Aprox.  .95 

3  (.14,  .20)  Al  menos  8/9  Aprox.  .997 

c.  No,  la  distribucion  de  n  =  4  mediciones  no 
puede  ser  de  forma  de  montfculo. 

2.63  68%;  95% 

2.65  a.  27;  20.2;  6.8  b.  ligeramente  sesgada  a  la 
izquierda  c.  23.96;  1.641  d.  maxima 

x  =  27,  marcadorz  =  1.85;  minima  x  =  20.2, 
marcadorz=  —2.29;  no  e.  24.3  f.  22.95 
y  24.85 

2.67  a.  s  ~  7.75  b.  x  =  59.2;  5  =  10.369 

c.  m  =  60,  Qi  =  51.25,  Q3  =  69.75;  cuartiles 
inferiores  y  superiores:  23.5  y  97.5;  no  hay 
resultados  atfpicos. 

2.69  cr«  100 

2.71  a.  16%  b.  81.5% 

2.73  a.  .9735  b.  .16 

2.75  a.  .025  b.  .84 

2.77  a.  Al  menos  3/4  tienen  entre  145  y  205 
profesores.  b.  .16 


2.81  a.  8.36  b.  4  c.  sesgada  a  la  derecha 

d.  cuartiles  inferiores  y  superiores:  —24.375  y 
42.625;  no;  sf 

2.83  b.  sf  c.  mas  de  2  o  3  desviaciones  estandar 
desde  la  media 

2.85  a.  2.5,  3.75,  4.2,  4.75,  5.7  b.  cuartiles  inferio¬ 
res  y  superiores:  2.25  y  6.25  c.  no 
d.  en  forma  de  montfculo;  sf 

2.87  b.  la  media  muestral  se  hace  mas  pequena 
d.  5  s  m  <  10 

2.89  c.  La  desviacion  estandar  cuando  se  divide  entre 
«—l  esta  mas  cerca  de  cr. 

2.91  b-c.  sesgada  a  la  izquierda  con  un  resultado  atfpi¬ 
co  a  la  derecha  de  las  obras  observaciones 
(x  =  520) 

Capi'tulo  3 

3.3  a.  graficas  de  pastel  comparativas;  graficas 
de  barras  pareadas  o  de  barras  en  columna 
c.  Las  proporciones  gastadas  en  las  cuatro  ca- 
tegorfas  son  considerablemente  diferentes  para 
hombres  y  mujeres. 

3.5  a.  Poblacion:  respuestas  a  la  pregunta  de  tiempo 
libre  para  todos  los  padres  e  hijos  en  Estados 
Unidos.  Muestra:  respuestas  para  las  398 
personas  del  estudio.  b.  datos  bivariados,  que 
miden  relation  (cualitativa)  y  respuesta  (cualitati- 
va)  c.  el  numero  de  personas  que  caen  en  la 
categorfa  de  relation-opinion  e.  graficas  de 
barras  en  columna  o  pareadas 


X 

y 

xy 

Calcule: 

Covarianza 

1 

6 

6 

n  =  3 

v  CS*)Ey) 

n 

Sxy~  ~  2 

n  -  1 

3 

2 

6 

s,=  1 

2 

4 

8 

Sy=  2 

Coeficiente  de  correlacion 

M 

* 

II 

07 

Csl 

II 

W 

Xxy  =  20 

Sxy 

r  ~  SxSy  ~ 

3.11  b.  Cuando  x  aumenta,  y  aumenta.  c.  .903 
d.  y  =  3.58  +  .815x;  sf 

3.13  b.  Cuando  x  aumenta,  y  disminuye.  c.  —.987 
3.15  a.  y  =  56.11  +  23.83x  c.  $199.06;  no 
3.17  b.  ligera  tendencia  positiva  c.  r  =  .760 
3.19  a.  precio  =  variable  dependiente;  tamano  = 
variable  independiente  b.  sf 
3.21  b.  La  productividad  del  profesor  parece  aumentar, 
con  menos  tiempo  necesario  para  escribir  libros 
despues;  no 

3.23  a.  edad  del  soldado  (cuantitativa),  estado  civil 
del  soldado,  recluta  u  oficial  (cualitativa),  rama 
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de  servicio  (cualitativa)  b.  la  poblacion  de 
respuestas  para  todos  los  soldados  en  el  Ejercito 
e  Infanterfa  de  Marina;  poblacion  en  un  momento 
fijo  en  el  tiempo  c.  graficas  de  barra  pareadas; 
graficas  de  barras  en  columna 

3.27  a.  .882  (.886  usando  la  salida  impresa  Minitab) 

b.  x  =  semanas  en  exhibition,  y  =  ingreso  bruto  a 
lafecha  c.  .148; —.642 

3.29  a.  no  b.  r  =  —.039;  si  c.  El  conglome- 
rado  grande  en  la  esquina  inferior  izquierda  no 
muestra  relacion  aparente;  7  a  10  estados  forman 
un  conglomerado  con  tendencia  lineal  negativa 

d.  reglamentos  ambientales  locales;  poblacion  por 
milla  cuadrada;  region  geograhca 

3.31  a.  oxido  de  aluminio  (cuantitativas),  sitio 

(cualitativas)  b.  niveles  mas  altos  de  oxido 
de  aluminio  en  Ashley  Rails  e  Isly  Thorns 

3.33  a.  ano  (cuantitativas),  numero  de  redes  de  hogar 
(cuantitativas),  tipo  de  red  (cualitativa) 

c.  Las  redes  inalambricas  aumentaran  y  las 
conectadas  disminuiran. 

3.35  a.  fuerte  relacion  lineal  positiva 

b.  .946  c.  b  «  1  d.  y=  12.221  +  .815jc 

3.37  b.  fuerte  relacion  lineal  negativa 

3.39  b.  debil  relacion  lineal  negativa  c.  si;  Juneau, 
Alaska  d.  relacion  negativa  mas  fuerte 

3.43  a.  .635 

3.45  a.  0.5  b.  aumenta  c.  2.0;  el  cruce  con  el 
eje  y  d.  3.25;  4 

Capi'tulo  4 

4.1  a.  {1,2,3,4,5,6}  c.  1/6 

e.  P(A)  =  1/6;  P(B)  =  1/2;  P(C)  =  2/3; 

P{D)  =  1/6;  P(E)  =  1/2;  P(F)  =  0 

4.3  />(£,)  =  .45;  P(E2)  =  .15;  P(E,)  =  .05  para 
i  =  3,  4, ....  10 

4.5  a.  {NDQ,  NDH,  NQH,  DQH}  b.  3/4 

c.  3/4 

4.9  a.  .58  b.  .14  c.  .46 

4.11  a.  seleccionar  al  azar  tres  personas  y  registrar  sus 
generos  b.  {FFF,  FMM,  MFM,  MMF,  MFF, 
FMF,  FFM,  MMM} 

c.  1/8  d.  3/8  e.  1/8 

4.13  a.  ordenar  A,  B,  C 

b.  [ABC,  ACB,  BAC,  BCA,  CAB,  CBA) 

d.  1/3,  1/3 

4.15  a.  .467  b.  .513  c.  .533 


4.17  80 

4.19  a.  60  b.  3,628,800 

c.  720  d.  20 

4.21  6720 
4.23  216 
4.25  120 
4.27  720 

4.29  a.  140,608  b.  132,600  c.  .00037 

d.  .943 

4.31  a.  2,598,960  b.  4  c.  .000001539 
4.33  5.720645  X  (1012) 

4.35  a.  49  b.  1/49  c.  2/7 

4.37  1/56 


4.41 


P[A) 

P[B) 

Condiciones  para 
eventos  Ay  B 

P[A  n  B) 

P(A  U  B) 

P(A\B) 

.3 

A 

Mutuamente  excluyentes 

0 

.7 

0 

.3 

A 

Independientes 

.12 

.58 

.3 

.1 

.5 

Independientes 

.05 

.55 

.1 

.2 

.5 

Mutuamente  excluyentes 

0 

.7 

0 

4.43 

a. 

3/5 

b.  4/5 

4.45 

a. 

1 

b.  1/5  c.  1/5 

4.47 

a. 

1 

b.  1  c.  1/3  d.  0  e. 

f. 

0 

g.  0  h.  1  i.  5/6 

4.49 

a. 

.08 

b.  .52 

4.51 

a. 

.3 

b.  no  c.  si 

4.53 

a. 

no,  porque  P(A  H  B)  A  0 

b. 

no,  porque  P(A)  A  P(A\B) 

4.55 

a. 

.14 

b.  .56  c.  .30 

4.59 

a. 

P(A) 

=  .9918;  P(B)  =  .0082 

b. 

P(A) 

=  .9836;  P(B)  =  .0164 

4.61 

.05 

4.63 

a. 

.99 

b.  .01 

4.65 

a. 

154/256  b.  155/256  c.  88/256 

d. 

88/154  e.  44/67  f.  23/35 

g- 

12/101  h.  189/256 

4.67 

a. 

.64 

b.  .4982  c.  .011236 

4.69 

a. 

.23 

b.  .6087;  .3913 

4.71 

.38 

4.73 

.012 

4.75 

a. 

.6585 

b.  .3415  c.  izquierda 
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4.77  .3130 

4.79  a.  P(D)  =  .10;  P(DC )  =  .90;  P(N  |  Dc )  =  .94; 
P(N  |  D)  =  .20  b.  .023  c.  .023 
d.  .056  e.  .20  f.  falso  negativo 

4.81  a.  continua  b.  continua  c.  discreta 
d.  discreta  e.  continua 

4.83  a.  .2  c.  n=  1.9;  a1  =  1.29; 
o-=1.136  d.  .3  e.  .9 

4.85  1.5 

4.87  a.  { S,  FS,  FFS,  FFFS} 

b.  p(l)  =  p(2)  =  p(3)  =  p{4)  =  1/4 

4.89  a.  p( 0)  =  3/10;  p(  1)  =  6/10;  p(2)  =  1/10 
4.91  a.  .1;  .09;  .081  b.  p(x)  =  (,9)x_I(.l) 

4.93  a.  4.0656  b.  4.125  c.  3.3186 

4.95  $1500 

4.97  a.  .28  b.  .18  c.  p  =  1.32;  cr  =  1.199 
d.  .94 

4.99  $20,500 
4.101  .0713 

4.103  P(A)  =  1/2;  P(B)  =  2/3;  P(A  fl  B)  =  1/3; 

P(A  U  B)  =  5/6;  P(Q  =  1/6;  P(A  D  Q  =  0; 
P(AUQ  =  2/3 

4.105  2/7 

4.107  p( 0)  =  .0256;  p(  1)  =  .1536;  p( 2)  =  .3456; 
p(3)  =  .3456;  p( 4)  =  .1296;  .4752 

4.109  a.  .4565  b.  .2530  c.  .3889 

4.111  3/10;  6/10 

4.113  a.  .73  b.  .27 
4.115  .999999 
4.117  8 

4.119  a.  .3582  b.  .4883  c.  .4467 

4.121  a.  1/8  b.  1/64  c.  No  necesariamente; 
podrian  haber  estudiado  juntos,  y  asf  sucesiva- 


mente. 

4.123 

a.  5/6 

b.  25/36 

c.  11/36 

4.125 

a.  .8 

b.  .64  c. 

.36 

4.127 

.0256;  .1296 

4.129 

.2;  .1 

4.131 

a.  .5182 

d.  .3906 

b.  .1136 

c.  .7091 

4.133 

a.  .0625 

b.  .25 

0 

1 

2 

p[x) 

6/15 

8/15 

1/15 

b.  p  =  2/3;  cr2  =  16/45 


4.137  a.  p( 2)  =  p(12)  =  1/36, p(3)  =  p(ll)  =  2/36, 
p(4)  =  p(10)  =  3/36,  /?(5)  =  p(  9)  =  4/36, 
p(  6)  =  p(  8)  =  5/36,  p(l)  =  6/36 

4.139  a.  /X0)  =  ,5,p(l)  =  .5 

Capftulo  5 

5.1 


k 

0 

1 

2 

3 

4 

5 

6 

7 

8 

P(x  <  k) 

.000 

.001 

.011 

.058 

.194 

.448 

.745 

.942 

1.000 

El  problema 

Lista  de 

valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la 
probabilidad 

Hallese  la 
probabilidad 

3  o  menos 

0, 1,2,3 

P[x  <  3) 

no  es  necesario 

.058 

3  o  mas 

3, 4,  5,  6, 7, 8 

P(x  >  3) 

1  -  P[xs  2) 

.989 

Mas  de  3 

4,  5,  6,  7,  8 

P(x>  3) 

1  -  P[xs  3) 

.942 

Menos  de  3 

0,1,2 

P(x<  3) 

P(xs  2) 

.011 

Entre  3  y  5 
(inclusive) 

3,4,5 

P(  3£x<5) 

P{xs  5)- 
P[xr<  2) 

.437 

Exactamente  3 

3 

P[x=  3) 

P[x<  3)- 
P[xs  2) 

.047 

5.3  no  binomial;  intentos  dependientes;  p  varfa  de  un 
intento  a  otro. 

5.5  a.  .2965  b.  .8145  c.  .1172 

d.  .3670 

5.7  a.  .097  b.  .329  c.  .671  d.  2.1 

e.  1.212 


5.9  p(0)  =  .000;  p(  1)  =  .002;  p( 2)  =  .015; 
p( 3)  =  .082;  p( 4)  =  .246;  p( 5)  =  .393; 

p(  6)  =  .262 


5.11 

a. 

.251 

b.  .618 

c.  .367 

d.  .633 

e. 

4  f. 

1.549 

5.13 

a. 

.901 

b.  .015 

c.  .002 

d. 

.998 

5.15 

a. 

.748 

b.  .610 

c.  .367 

d. 

.966 

e.  .656 

5.17 

a. 

1;  .99 

b.  90;  3 

c.  30;  4.58 

d. 

70;  4.58 

e.  50;  5 

5.19 

a. 

.9568 

b.  .957 

c.  .9569 

d. 

p  =  2 ;  cr=  1.342 

e.  .7455; 

.9569; 

.9977  f.  si;  si 

5.21  no;  la  variable  no  es  el  numero  de  exitos  en  n 
intentos.  En  cambio,  el  numero  n  de  intentos  es 
variable. 


5.23 

a. 

1.000 

b.  .997 

c.  .086 

5.25 

a. 

.098 

b.  .991 

c.  .098  d.  .138 

e. 

.430 

f.  .902 

5.27 

a. 

.0081 

b.  .4116 

c.  .2401 

www.FreeLibros.me 


RESPUESTAS  A  EJERCICIOS  SELECCIONADOS  O  727 


5.29  a.  p  =  10  b.  4  a  16  c.  Si  este  improbable 
valor  se  observara  en  realidad,  podrfa  ser 
posible  que  los  intentos  (campos)  no  sean 
independientes. 

5.31  a.  .016796  c.  .98320 

5.33  a.  .107  b.  .762 

5.35 


Probabilidad 

Formula 

Valor  calculado 

P[x  =  0) 

mV"_  2.5V25 
k\  0! 

.082085 

P[x=  1) 

AtV"_  2.5V25 
k\  1! 

.205212 

P(x=2) 

mV"  2.5V25 
k\  2! 

.256516 

P( 2  o  menos 
exitos) 

P(x  =  0)  +  P(x  =  1 ) 

.543813 

5.37 


k 

0 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

P(x<k) 

.055 

.199 

.423 

.647 

.815 

.916 

.966 

.988 

.996 

.999 

1.000 

El  problema 

Lista  de 
valores  de  x 

Escriba  la 
probabilidad 

Reescriba  la 
probabilidad 

Hallese  la 
probabilidad 

3  o  menos 

0, 1,2,3 

P(x<  3) 

no  es  necesario 

.647 

3  o  mas 

3, 4,  5, . . . 

~o 

IV 

CO 

1  -  P(xr<  2) 

.577 

Mas  de  3 

4,  5,  6, . . . 

P(x>  3) 

1  -  P(xs  3) 

.353 

Menos  de  3 

0,1,2 

P(x<  3) 

P(x<  2) 

.423 

Entre  3  y  5 
(inclusive) 

3,4,5 

P(  3<x<5) 

P(xr<  5)- 
P(xs  2) 

.493 

Exactamente  3 

3 

~o 

II 

CO 

P[xs  3)- 
P(x£  2) 

.224 

5.39  a.  .135335  b.  .27067  c.  .593994 
d.  .036089 

5.41  a.  .677  b.  .6767  c.  si 
5.43  a.  .0067  b.  .1755  c.  .560 
5.45  a.  .271  b.  .594  c.  .406 
5.47  P(x  >  5)  =  .017;  improbable. 

5.49  a.  .6  b.  .5143  c.  .0714 

5.51  a.  p( 0)  =  .36;  /?(  1)  =  .48;  p( 2)  =  .15;  p( 3)  = 

.01  c.  p  =  .8,  cr2  =  .50286  d.  .99;  .99;  si 
5.53  p( 0)  =  .2;  p(  1)  =  .6;  p{2)  =  .2 
5.55  a.  hipergeometrica  b.  .1786  c.  .01786 
d.  .2857 

5.61  a.  p( 0)  =  .729;  p(  1)  =  .243;  p( 2)  =  .027; 

p( 3)  =  .001  c.  .3;  .520  d.  .729;  .972 

5.63  a.  .234  b.  .136  c.  Lo  dicho  no  es  impro¬ 
bable. 

5.65  a.  .228  b.  no  es  indicacion  de  que  sea  mas 
probable  que  las  personas  escojan  numeros  del 
medio 


5.67  a.  p  =  280  b.  cr  =  9.165  c.  261.67  a 
298.33  d.  si;  x  =  225  esta  6  desviaciones 
estandar  debajo  de  la  media. 

5.69  a.  20  b.  4  c.  .006  d.  El  psiquiatra 
esta  equivocado. 

5.71  a.  p  =  50;  cr  =  6.124  b.  El  valor  x  =  35  esta 
2.45  desviaciones  estandar  debajo  de  la  media. 

Es  un  tanto  improbable  que  la  cifra  de  25%  sea 
representativa  de  este  plantel. 

5.73  a.  .5  b.  p  =  12.5;  cr  =  2.5 

c.  Hay  preferencia  por  el  segundo  diseno. 

5.75  a.  si;  n  =  10;  p  =  .25  b.  .2440 

c.  .0000296  d.  Si;  el  modelo  genetico  no  se 
comporta  como  se  esperaba. 

5.77  a.  si  b.  1/8192  =  .00012 

5.79  a.  hipergeometrica,  o  aproximadamente 

binomial  b.  Poisson  c.  aproximadamente 
.85;  .72;  .61 

5.81  a.  .015625  b.  .421875  c.  .25 

5.83  a.  p  =  1/3  b.  .3292  c.  .8683 

5.85  a.  14  b.  2.049  c.  no;  x  =  10  esta 
solo  a  1.95  desviaciones  estandar  debajo 
de  la  media 

5.87  a.  .135335  b.  .676676 

5.89  .655 

5.91  a.  .794  b.  .056  c.  -0.82  a  3.82  o  0  a  3 

5.93  a.  36  b.  4.8 

c.  Si,  porque  x  =  esta  a  2.71  desviaciones  estan¬ 
dar  arriba  de  la  media. 


5.95 

a. 

.00006 

b.  .042 

c.  .0207 

d. 

.5948 

e.  1 

5.99 

a. 

.0176 

b.  .9648 

c.  .9648 

Capi'tulo  6 

6.1 


El  intervalo 

Escriba  la 
probabilidad 

Reescriba  la 
probabilidad 

Hallese  la 
probabilidad 

Menos  de  -2 

P(z<  -2) 

no  es  necesario 

.0228 

Mayor  a 

P(z>  1.16) 

1  -  P(z£  1.16) 

.1230 

1.16 

Mayor  a 

P(z>  1.645) 

1  -  P(z£  1.645) 

.0500 

1.645 

Entre  -2.33 

P( — 2.33  <  z 

P(z=s  2.33)  — 

.9802 

y  2.33 

<  2.33) 

P(z<  -2.33) 

Entre  1.24 

P(1 .24  <z<  2.58) 

P(z==  2.58)  — 

.1026 

y  2.58 

P(z£  1.24) 

Menor  o  igual 

P(z<  1.88) 

no  es  necesario 

.9699 

a  1.88 
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6.3 

a.  .9452 

b.  .9664 

c.  .8159 

d.  1.0000 

6.71 

7.301  onzas 

6.5 

a.  .6753 

b.  .2401 

c.  .2694 

6.73 

a.  141  b.  .0401 

d.  .0901 

e.  «  0 

6.75 

.9474 

6.7 

a.  1.96 

b.  1.44 

6.77 

.3557 

6.9 

a.  1.65 

b.  -1.645 

6.79 

a.  Qi  =  269.96;  Q3  =  286.04  b.  sf;  x  = 

6.11 

a.  1.28 

b.  1.645 

c.  2.05 

d.  2.33 

esta  a  8.17  desviaciones  estandar  debajo  de 

6.13 

a.  .1596 

b.  .1151 

c.  .1359 

media. 

6.15 

58.3 

6.81 

a.  ~  0  b.  .6026  c.  La  muestra  no 

6.17 

fx  =  8;  cr 

=  2 

aleatoria;  los  resultados  estaran  sesgados. 

6.19 

a.  .1949 

b.  .4870 

c.  no 

d.  sf; 

6.83 

a.  ±.52  desviaciones  estandar 

>’=18  esta  a  3.82  desviaciones  estandar  arriba 

b.  ±  1 .28  desviaciones  estandar 

de  la  media. 

6.85 

a.  .3085  b.  99.92  grados 

6.21 

a.  .4586 

b.  .0526 

c.  .0170 

6.87 

a.  .9544  b.  .0561 

6.23 

.1562;  .0012 

6.89 

a.  z0  =  -1.96  b.  z0  =  -36 

6.25 

a.  .0475 

b.  .00226 

c.  29.12  a 

6.91 

a.  .9651  b.  .1056  c.  .0062 

40.88 

d.  38.84 

6.93 

a.  .0442  b.  .0445 

6.27 

a.  .1056 

b.  .2676 

6.95 

a.  1.273  b.  .1016 

6.29 

.0475 

6.97 

.1244  (probabilidad  exacta  =  .1236) 

6.31 

63,550 

6.33 

a.  .3085 

b.  .2417 

c.  .0045 

Capi'tulo  7 

6.35  a.  15;  10  b.  sf  c.  15;  2.449 
d.  10,  11, ...  ,25  e.  10;  9.5 
f.  z  =  -2.25  g.  -2.25;  .0122;  .9878 


6.37 

a. 

sf 

b.  ix  =  7.5;  cr=  2.291 

c. 

.6156 

d.  .618 

6.39 

a. 

.2676 

b.  .3520  c.  .3208 

6.41 

a. 

.178 

b.  .392 

6.43 

a. 

.245 

b.  .2483 

6.45 

a. 

.0446 

b.  .0104  c.  .0446 

d. 


.9162 


6.47  .9441 


6.49  a.  .5000  b.  No  consideran  la  estatura  al  votar. 
6.51  a.  .0050  b.  .8394  c.  .9767 

d.  si;  la  parte  del  mercado  de  Pepsi  es  mas  grande 
que  lo  dicho. 

6.53  a.  31  b.  3.432  c.  no;  x  =  25  esta  a  solo 
1.75  desviaciones  estandar  debajo  de  la  media. 
6.55  a.  .3227  b.  .1586 


6.57  z0  =  0 

6.59  Z()  =  .67;  los  percentiles  25avo  y  75avo 

6.61  no 


6.63  5.065  meses 
6.65  .0336 
6.67  85.36  minutos 


7.1  1/500 

7.11  a.  muestra  de  conveniencia  c.  SI,  pero  solo 
si  los  estudiantes  se  comportan  como  una  muestra 
aleatoria  de  entre  la  poblacion  general  de  jovenes 
nativos  americanos. 

7.13  a.  primera  pregunta  b.  Disminuyo  el  porcen- 
taje  a  favor  del  programa,  quiza  debido  a  la  frase 
de  “gastan  miles  de  millones  de  dolares”  de  la 
pregunta. 

7.15  normal;  53;  3 
7.17  normal;  100;  3.16 

7.19  a.  n  =  10;  a/Vn  =  .5 

b.  /r,  =  5;  cr/Vn  =  .2 

c.  fx  =  120;  cr/Vn  =  .3536 
7.21  c.  aprox.  En  forma  de  montlculo 

7.23  a.  1  b.  .707  c.  .500  d.  .333 
e.  .250  f.  .200  g.  .100 

7.25  a.  106;  2.4  b.  .0475  c.  .9050 

7.27  b.  un  numero  grande  de  replicas 

7.31  a.  1890;  69.282  b.  .0559 

7.33  a.  ~  0  b.  si;  el  valor  x  =  98.25  esta  casi  5 

desviaciones  estandar  debajo  de  la  media  supuesta, 


6.69  no;  x  =  184  esta  a  solo  1.26  desviaciones  estandar 
debajo  de  la  media. 


H  =  98.6. 

7.35  normal;  .7;  .0648 
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7.37  a.  p  =  .3;  SE  =  .0458  b.  p  =  .1; 

SE=m5  c.  p  =  .6;SE=  .0310 
7.39  a.  .7019  b.  .5125 

7.41  a.  .0099  b.  .03  c.  .0458  d.  .05 

e.  .0458  f.  .03  g.  .0099 

7.43  a.  si;  p  =  .19;  SE  =  .03923  b.  .0630 

c.  .0604  d.  El  valor  es  inusual  porque  p  =  .30 
esta  2.80  desviaciones  estandar  arriba  de  la  media 
p  =  .19. 

7.45  a.  aproximadamente  normal  con  media  .  1 3 
y  desviacion  estandar  .0453  b.  .9382 
c.  «0  d.  .04  a. 22 

7.47  a.  aproximadamente  normal  con  media  .75 
y  desviacion  estandar  .0306  b.  .0516 
c.  .69  a. 81 

7.49  a.  LCL  =  150.13;  UCL  =  161.67 
7.51  a.  LCL  =  0;  UCL  =  .090 
7.53  a.  LCL  =  8598.7;  UCL  =  12,905.3 
7.55  LCL  =  .078;  UCL  =  .316 
7.57  LCL  =  .0155;  UCL  =  .0357 
7.59  media  demasiado  grande  a  las  horas  2,  3  y  4 
7.63  a.  ~  12.5  b.  .9986  c.  Es  probable  que 
sean  correctas. 

7.65  c.  no 

7.71  a.  muestra  de  conglomerado  b.  muestra 
sistematica  de  1  en  10  c.  muestra  estra- 
tificada  d.  muestra  sistematica  de  1  en 
10  e.  muestra  aleatoria  simple 

7.73  a.  131.2;  3.677  b.  si  c.  .1515 
7.75  a.  LCL  =  0;  UCL  =  .0848  b.  p  >  .0848 

7.77  si 

7.81  a.  aproximadamente  normal  con  media  de  288 
y  desviacion  estandar  .9798  b.  .0207 
c.  .0071 


8.1 1  p  =  .728;  margen  de  error  (MOE)  =  .029 
8.13  x  =  39.8;  MOE  =  4.768 

8.15  x=  7.2%;  MOE  =  .776  , _ 

8.17  a.  p  =  .51;  MOE  =  .0327  b.  1.96^^^ 
8.19  a.  no  b.  nada;  no 

8.21  Estimacion  puntual  es  x  =  19.3  con  margen  de 
error  =  1.86. 

8.23  a.  (.797,  .883)  b.  (21.469,22.331) 

c.  Los  intervalos  construidos  de  este  modo  encie- 
rran  el  verdadero  valor  de  p  90%  del  tiempo  en 
muestreo  repetido. 

8.25  (.846,  .908) 

8.27  a.  3.92  b.  2.772  c.  1.96 
8.29  a.  3.29  b.  5.16  c.  El  ancho  aumenta. 
8.31  (3.496,  3.904);  muestra  aleatoria 
8.33  a.  (.932,  1.088)  c.  no;  p  =  1  es  un  posible 
valor  para  la  media  poblacional 

8.35  a.  (.106,  .166)  b.  Aumente  el  tamano  mues- 
tral  y/o  disminuya  el  nivel  de  confianza. 

8.37  a.  98.085  <  p  <  98.415  b.  no;  quiza  el  valor 
98.6  no  es  el  verdadero  promedio  de  temperatura 
corporal  para  personas  sanas. 

8.39  a.  (4.61,5.99)  b.  si 
8.41  (15.463,36.937) 

8.43  a.  (17.676,  19.324)  b.  (15.710,  17.290) 
c.  (.858,  3.142)  d.  si 

8.45  a.  Xi  —  x2  =  2617;  MOE  =  902.08  b.  si 
8.47  a.  (3.333,  16.667)  b.  (-22.040,  -7.960) 
c.  no  d.  si;  si 

8.49  a.  (—.528,  —  .032);  si,  porque  pt  —  p2  =  0  no 
esta  en  el  intervalo. 

8.51  a.  (—.203, —.117)  b.  muestras  aleatorias 
e  independientes  de  distribuciones  binomiales 


7.83  UCL  =  .2273;  LCL  =  -.0273 
7.85  a.  3.5;  1.208 
7.87  a.  3.5;  .854 

7.89  a.  .4938  b.  .0062  c.  .0000 


Capitulo  8 


8.3  a.  .160 
8.5  a.  .554 
8.7  a.  .179 

8.9  a.  .0588 
e.  .0588 


b.  .339 
b.  .175 
b.  .098 

b.  .0898 

f.  p  =  .5 


c.  .438 
c.  .055 
c.  .049 
c.  .098 


d.  .031 
d.  .0898 


8.53  a.  (-.221,  .149)  b.  no 
8.55  a.  (—.1 18, —.002)  b.  St  porque 
Pi  —  p2  =  0  o  esta  en  el  intervalo. 
8.57  a.  (.095,  .445)  b.  si 
8.59  (.061,  .259) 

8.61  a.  (—.082,  .022)  b.  No,  porque 
Pi  ~  Pi  =  0  no  esta  en  el  intervalo. 

8.63  1.96^;  1.96^^;  385; 

cuantitativo;  uno;  1.96-^=;  97 
Vn 

8.65  a.  p  <  76.63  b.  p  <  1.89 
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8.67 

Mi  -  <  4 

8.69 

505 

8.71 

iii  =  «2  =  1086 

8.73 

b.  9604 

8.75 

«i  =  n2  =  360 

8.77 

97 

8.79 

/7 1  =  n2=  136 

8.81 

iii  =  n2  =  98 

8.83 

a.  x  =  29.1;  MOE  =  .9555 

b.  (28.298, 

29.902)  c.  m>  28.48 

d.  234 

8.85 

n  i  =  n2  =  224 

8.87 

1083 

8.89 

ip  =  n2  =  925 

8.91 

a.  pw  —  .5;  Pm  —  .75  b. 

—  .313  <  pw  — 

Pm<  —.187  c.  Hay  una 

diferencia  en  las 

dos  proporciones. 

8.93 

(8.087,  11.313) 

8.95  97 

8.97  (33.41,34.59) 

8.99  a.  MOE  =  .029  b.  6147 
8.101  a.  (.522,  .578)  b.  (.035,  .145);  sf. 

8.103  almenosl825 

8.105  .3874;  .651 

8.107  a.  (2.837,  3.087)  b.  276 

8.109  ($10.52,  $12.38);  no 

8.111  (2.694,2.716) 

8.113  (.161,  .239) 

8.115  al  menos  97 

8.117  b.  Los  anchos  son  iguales. 

8.119  a.  9.702  b.  (746.298, 765.702)  c.  sf 

8.121  b.  El  error  estandar  y  el  ancho  del  intervalo 
disminuyen. 


Capi'tulo  9 

9.1 


Estadistico 

de  prueba 

Nivel  de 

signifi¬ 

cance 

/Prueba  de 

una  o  de 

dos  colas? 

Valor 

critico 

Region 

de  rechazo 

Conclusion 

z=  0.88 

a  =  .05 

Dos  colas 

1.96 

|z|  >  1.96 

No  rechazar  H0 

z  —  -2.67 

a  =  .05 

Una  cola 

(inferior) 

1.645 

z  <  -1.645 

Rechazar  H0 

z=  5.05 

a-  .01 

Dos  colas 

2.58 

|z|  >  2.58 

Rechazar  H0 

z  —  -1.22 

a-  .01 

Una  cola 

(inferior) 

2.33 

z <  -2.33 

No  rechazar  H0 

9.3  a.  z  >  2.33  b.  \z\  >  1.96 
c.  z  <  —2.33  d.  |z|  >  2.58 
9.5  a.  No  rechazar  los  resultados  no  son  estadfsti- 
camente  significativos.  b.  Rechazar  //„; 
los  resultados  son  altamente  significativos. 
c.  Rechazar  /7n;  los  resultados  son  estadfsticamente 
significativos. 

9.7  a.  .0207  b.  Rechazar  Hn\  los  resultados  son 
estadfsticamente  significativos.  c.  sf 

9.9  Valor  p  =  .0644;  no  rechazar  H0;  los  resultados  no 
son  estadfsticamente  significativos. 

9.11  a.  H0:  pu  =  1 ;  Ha:  pi  +  1 

b.  Valor  p  =  .7414;  no  rechazar  H0 

c.  No  hay  evidencia  para  indicar  que  el  peso 
promedio  sea  diferente  de  1  libra. 

9.13  a.  H0:  pu  =  80  b.  H,:  pi  *  80 
c.  z  =  —3.75;  rechazar  H0 

9.15  a.  z  =  2.63;  valorp  =  .0043;  rechazar H0  alos 
niveles  de  significance  de  1%  y  5% 

9.17  sf;  z  =  10.94 

9.19  no;  z  = —1.334  con  valor/?  =  .0918; 
no  rechazar  H0 

9.21  a.  H0:  /tj  —  p^  =  0;  //a:  p,i  —  pu2>  0; 
una  cola  b.  z  =  2.074;  rechazar  H0 

9.23  a.  z  =  —2.26;  valor  p  =  .0238;  rechazar  H0 
b.  (-3.55,  -.25)  c.  no 

9.25  a.  H0 :  p,x  —  pu2  =  0;  //a:  Mi  —  M2  ^  0 
b.  sf;  z  =  8.77  c.  valor  p  ~  0 
9.27  a.  sf;  z  =  —3.18;  valor  p  =  .0014 

b.  (-3.01,  -.71);  sf 

9.29  a.  z  =  —2.22  con  valor  p  =  .0264  b.  signifi- 
cativa  al  nivel  de  5%  pero  no  al  del  1%. 

9.31  H0 :  p  =  .4;  //a:  /?  +  .4  b.  valor  /?  =  .093;  no 
estadfsticamente  significativa  c.  no 
9.33  a.  H0\p  =  .15;  H„:  p  <  .15  b.  Rechazar  H0\ 
z  =  -4.53.  c.  ~  0 
9.35  a.  H0:  p  =  2/3  b.  //a:  /?  >  2/3 

c.  sf;  z  =  4.6  d.  valor/?  <  .0002 
9.37  no;  z  =  -.90 

9.39  no;z  =  -1.06 
9.41  no;  z  =  —.71 

9.43  a.  H0:  px  -  p2  =  0;  //a:  /?j  -  p2  <  0 

b.  de  una  cola  c.  No  rechazar  H0\  z  =  —.84 

9.45  a.  sf;  z  =  -2.40  b.  (-.43,  -.05) 

9.47  No  rechazar  Ha\  z  =  —.39;  hay  suficiente  eviden¬ 
cia  para  indicar  una  diferencia  en  las  dos  propor- 
ciones  poblacionales. 
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9.49  px  —  p2  >  .001;  el  riesgo  es  al  menos  1/1000  mas 
alto  al  tomar  Preparo. 

9.51  Rechazar  H0\  z  =  3.14  con  valor  =  .0008; 

se  confirman  las  conclusiones  del  investigador. 
9.55  La  potencia  aumenta. 

9.57  a.  valor  p  <  .0002  b.  Rechazar  H0\ 

Z  =  4.47 

9.59  a.  H0:  p  =  7.5;  Hp.  p  <  7.5 

b.  de  una  cola  d.  z  =  —5.477;  rechazar  H0 

9.61  a.  H0\  p\  p2  —  0;  Hp.  pi  —  p2  +  0 

b.  de  dos  colas  c.  no;  z  =  —.954 

9.63  no;  no  rechazar  /70;  z  =  1  -684 

9.65  a.  no,  z=  -16  b.  .4364 

c.  No  rechazar  H0. 

9.67  si;  z  =  4;  rechazar  H0 
9.69  si;  z  =  4.00 

9.71  a.  si;  z  =  4.33  b.  (7.12,  18.88) 

9.73  a.  no;  z  =  —.92  b.  no;  z  =  —.42  c.  no 
9.75  no;  z  =  2.19 
9.77  si;  z  =  -2.08 
9.79  si;  z  =  3.32 

9.81  a.  (1447.49.4880.51)  b.  entre  1500  y  5000 
mas  metros  por  semana;  tienen  solo  un  tipo  de 
brazada  para  practicar. 

9.83  a.  Ha:  p  =  94;  H,:  p  *  94 

b.  z  =  -1.331  c.  .1832 

d.  No  rechazar  H0.  e.  no 

9.85  a.  .7422  b.  .9783  c.  la  potencia  aumenta 

Capi'tulo  10 

10.1  a.  2.015  b.  2.306  c.  1.330 
d.  1.96 

10.3  a.  .02  <  valor p  <  .05 

b.  valor  p  <  .005  c.  valor  p  >  .20 
d.  valor  p  <  .005 

10.5  a.  x  =  7.05;  s  =  .4994  b.  (7.496) 

c.  Rechazar  Ha\  t  =  —2.849  d.  SI. 

10.7  no;  t  =  -1.195 

10.9  a.  si;  t  =  -3.044  b.  98.316 
10.11  (3.652,3.912) 

10.13  a.  Rechazar  H0\  t  =  —4.31.  b.  (23.23, 

29.97)  c.  La  media  de  tratamiento  previo 
se  ve  mas  pequena  que  las  otras  dos  medias. 

10.17  (233.98,259.94) 

10.19  a.  3.775  b.  21.2258 


10.21  a.  H0 :  p,  —  p2  =  0;  Ha:  px  —  p2  0 
b.|f|>  2.771  c.  f=  2.795 

d.  valor  p  <.01  e.  Rechazar  H0 
10.23  a.  si;  (s2  mayor)/(s2  menor)  =  1.36 

b.  t  =  .06  con  valor  p  =  .95 

c.  19.1844  d.  No  rechazar  H0. 

e.  (-5.223,  5.503);  si 

10.25  a.  no;  t  =  —1.16  b.  valor  p  =  .260 

c.  si;  (j2  mayor)/(s2  menor)  =  2.88 

10.27  a.  no;  (s2  mayor)/(j2  menor)  =  16.22 
b.  si;  t  =  —2.412;  .02  <  valor  p  <  .05 

1 0.29  a.  si  b.  no;  (s2  mayor)/(.v2  menor)  = 

3.72  c.  No  rechazar  H0\  t  =  .  10  con  valor 

p  >  .20. 

10.31  No  rechazar  H0\  t  =  0.24  con  valor  p  >  .10. 

10.33  a.  No  rechazar  7/0;  t  =  —.93. 

b.  (— 5.81,  2.18),  usando  df  =  29;  si 
10.35  a.  Rechazar  H0;  t  =  2.372  con  .02  <  valor  p. 

<  .05  b.  (.014,  .586)  c.  62  pares 
10.37  a.  No  rechazar  H0\  t  =  1.177. 

b.  valor  p  >  .20  c.  (—.082,  .202) 

d.  muestra  aleatoria  desde  distribucion  normal 

10.39  a.  No  rechazar  H0\  t  =  1.984;  (—7.28, 

170.94).  b.  Rechazar  H0;  t  =  2.307;  (6.867, 
208.433).  c.  Rechazar  H0\  t  =  4.38. 

d.  (-1.6,  8.2);  si 

10.41  b.  si;  t  =  9.150  con  valor  p  <  .01 

c.  (80.472,  133.328) 

10.43  a.  si;  t  =  —4.326;  rechazar  H0. 

b.  (—2.594, —.566)  c.  al  menos  65  pares 

10.45  a.  si;  t  =  2.82;  rechazar  H0.  b.  1.488  d.  si 

10.47  No  rechazar  H0\  t  =  1.03  con  valor  p  >  .10; 
no  continuar  con  la  instalacion. 

10.49  (.190,  .685) 

10.51  Rechazar  H0\  =  22.449. 

10.53  a.  no;  t  =  -.232  b.  si;  *2  =  20.18 
10.55  a.  no  b.  si;  z  =  3.262 
10.57  no;*2  =  29.433 
10.59  (.667,4.896) 

10.61  F  =  1.057  con  valor  p  >  .20;  no  rechazar  H0: 

2 _ 2 

cr  i  —  cr2. 

10.63  (1.544,4.003) 

10.65  Resto:  F  =  1.03  con  valor  p  >  .20;  80%  maximo 
CL:  F  =  2.01  con  valor  p  >  .20;  maximo  02; 

F  =  14.29  con  valor  p  <  .01;  use  la  prueba  t  no 
agrupada  para  un  maximo  de  02. 

10.71  (9.860,  12.740) 
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10.73  sf,  t  =  5.985;  rechazar //0;  (28.375,  33.625). 
10.75  sf,  F  =  3.268 

10.77  72 

10.79  (22.578,26.796) 

10.81  almenosl36  b.  Bajar  el  nivel  de  confian- 
za;  redisenar  el  experimento  como  una  prueba 
de  diferencia  pareada. 

10.83  a.  sf  b.  F  =  19.516;  hay  una  diferencia  en 
las  varianzas  de  poblacion. 

1 0.85  a.  muestras  aleatorias  independientes  de  distri- 
buciones  normales  con  varianzas  iguales;  no 

b.  sf;  t  =  3.237  con  valor  p  <  .01 

c.  sf;  t  =  60.36  con  valor  p  <  .01 
10.87  no;  f  =  2.2  con  valor p  >  .10 
10.89  no;  t  =  —  All  con  valor p  >  .20 
10.91  no,  t  =  -1.712 

10.93  no  pareada:  (—1.69,  .19);  pareada:  (1.49,  —.01); 
el  intervalo  apareado  es  ligeramente  mas 
angosto. 

10.95  a.  no,  t  =  2.571  b.  (.000,  .020) 

10.97  a.  de  dos  colas;  Hp.  a]  #  a\  b.  de  cola 
inferior;  Hp.  ar\  <  a\  c.  de  cola  superior; 
Hh:  a]  >  cr\ 

10.99  a.  no,  /  =  7.008  b.  (.185,  2.465) 

10.101  Rechazar  H0\  t  =  2.425;  la  droga  aumenta  el 
tiempo  promedio  de  reaccion. 

10.103  sf,  t  =  -2.945 

10.105  no 

10.107  no,  t  =  1.86  con  valor /i  =  .1 12 
10.109  Use  prueba  t  agrupada;  t  =  —1.82  con  valor 
p  >  .10;  los  resultados  son  no  significativos. 

10.111  a.  (5.814,7.886)  b.  muestra  aleatoria;  la 
poblacion  muestreada  es  normal. 

10.113  Rechazar  H0;  t  =  4.57;  sf. 

10.115  a.  Rechazar  H0\  t  =  4.38;  sf. 
b.  valor  p  <  .01;  sf 

10.117  a.  t>  1.8  b.  |?|  >  2.37  c.  t  < -2.6 
10.121  No  rechazar  H0;  t  =  — 1.438  con  valor 
p  =  .1782 

10.123  sf;  f  =  —3.33  con  valor/?  =  .0030 

Capi'tulo  1 1 

11.1  Fuente  df 

Tratamientos  5 
Error  54 

Total  59 


11.3  a.  (2.731,3.409)  b.  (.07,  1.03) 

11.5  a.  Fuente  df  SS  MS  F 

Tratamientos  3  339.8  113.267  16.98 

Error_ 20  133.4  6.67 

Total  23 

b.  df\  =  3  y  df2  =  20  c.  F  >  3.10 
d.  sf,  F  =  16.98  e.  valor  p  <  .005;  sf 

11.7  a.  CM  =  103.142857;  SS  Total  =  26.8571 

b.  SST  =  14.5071;  MST  =  7.2536 

c.  SSE  =  12.3500;  MSE  =  1.1227 

d.  Analysis  of  Variance 


Source 

DF 

SS 

MS 

F 

P 

Trts 

2 

14 . 51 

7.25 

6.46 

0 . 014 

Error 

11 

12.35 

1 . 12 

Total 

13 

26 . 86 

f.  F  =  6.46;  rechazar  H0  con  .01  <  valor  p  <  .025. 
11.9  a.  (1.95,  3.65)  b.  (.27,  2.83) 

11.11  a.  (67.86,84.14)  b.  (55.82,76.84) 

c.  (  —  3.629,22.963)  d.  No,  no  son  indepen¬ 
dientes. 

11.13  a.  Cada  observacion  es  la  longitud  media 
de  10  hojas  b.  sf,  F  =  57.38  con  valor 
p  =  .000  c.  Rechazar  H0\  t  =  12.09. 

d.  (1.810,2.924) 


11.15 

Analysis  of  Variance  for  Percent 


Source 

DF 

SS 

MS  F 

P 

Method 

2 

0 . 0000041 

0.0000021  16.38 

0 . 000 

Error 

12 

0 . 0000015 

0 . 0000001 

Total 

14 

0 . 0000056 

11.17 

a.  diseno  completamente  aleatorizado 

b. 

Source 

DF 

SS 

MS  F 

P 

State 

3 

3272.2  1090.7  26.44  0.000 

Error 

16 

660 . 0 

41.3 

Total 

19 

3932.2 

c.  F 

=  26.44;  rechazar  H0  con  valor  p  = 

.000. 

11.19  Las  medias  muestrales  deben  ser  independientes; 

tamanos  muestrales  iguales. 

11.21  a.  1.878s  b.  2.1567s 
1 1 .23  xl  x2  x3  x4 
1 1 .25  a.  no;  F  =  .60  con  valor  p  =  .562 
b.  no  hay  diferencias 
1 1 .27  a.  sf;  F  =  8.55,  valor p  =  .005 


b.  (-157. 

41,  - 

-28.59) 

C.  X3  Xl  x2 

11.29  Fuente 

df 

SS 

MS 

F 

Tratamientos 

2 

11.4 

5.70 

4.01 

Bloques 

5 

17.1 

3.42 

2.41 

Error 

10 

14.2 

1.42 

Total 

17 

42.7 
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11.31  (-3.833, -.767) 
11.33  a.  sf;  F  =  19.19 

c.  3q  x}  x4  x2 

e.  si 

11.35  a.  7 

9.68 

11.37 


b.  sf;  F  =  135.75 
d.  (-5.332,  -2.668) 


b.  7  c.  5  e.  sf;  F  = 
f.  sf;  F  =  8.59 


ANOVA  de  dos  vias  y  contra  bloques 

Analysis  of  Variance  for  y 


b.  No.  F  =  1.47;  valor  p  =  .248.  c.  no 
F  =  3.46;  valor  p  =  .087.  d.  sf 

F  =  1 17.49;  valor p  =  .000. 

1 1 .57  diferencias  significativas  entre  los  tratamientos  A 
yC,  ByC,  CyEyDyE 

1 1 .59  a.  diferencia  significativa  en  medias  de  trata- 
miento;  F  =  27.78  b.  co  =  .  190  de  Tukey 

c.  sf;  F  =  6.59 

11.61 


Source 

DF 

SS 

MS  F  P 

ANOVA  de  una  via:  ventas  contra  programa 

Blocks 

2 

7 . 1717 

3.5858  40.21  0.000 

Analysis 

of  Variance  for  Sales 

Chemical 

3 

5.2000 

1.7333  19.44  0.002 

Source 

DF  SS  MS  F  P 

Error 

6 

0 . 5350 

0 . 0892 

Program 

3  1385.8  461.9  9.84  0.000 

Total 

11 

12 . 9067 

Error 

23  1079.4  46.9 

11.39  a. 

si;  F 

=  10.06 

b.  si;  F  =  10.88 

Total 

26  2465.2 

c. 

co  = 

4.35  d. 

(1.12,5.88) 

11.63 

a. 

no;  F  =  1.40  b.  valor  p  >  .10 

11.41 

c. 

sf;  F  =  6.51  d.  sf;  F  =  131 

ANOVA  de  dos  vias:  costo  contra  estimador,  trabaio 

11.65 

a. 

experimento  factorial  de  2  X  3  b. 

Analysis 

of  Variance  for  Cost 

F 

=  .45  con  valor  p  =  .642 

Source 

DF 

ss 

MS  F  P 

d. 

(-22.56,  -5.84) 

Estimator 

2 

10 . 862 

5.431  7.20  0.025 

11.67 

a. 

diseno  de  bloques  aleatorizado 

Job 

3 

37.607  12.536  16.61  0.003 

Error 

6 

4 . 528 

0 . 755 

D. 

Total 


11  52.997 


1 1 .43  a.  Los  bloques  son  artfculos;  los  tratamientos  son 
tiendas.  b.  sf,  F  =  14.79;  valor  p  =  .000 
c.  sf,  F  =  19.39;  valor  p  =  .000 
1 1 .45  a.  20  b.  60  c.  Fuente  df 


ANOVA  de  dos  vias:  total  contra  semana,  tienda 

Analysis  of  Variance  for  Total 


A 

B 

AB 

Error 


3 

4 
12 
40 


Source 

DF 

ss 

MS 

F 

p 

Week 

3 

571 . 7 

190 . 6 

8.27 

0.003 

Store 

4 

684 . 6 

171.2 

7.43 

0.003 

Error 

12 

276.4 

23 . 0 

Total 

19 

1532 . 7 

c.  si; 

F  =  7.43 

d. 

(O  = 

10.82 

Total 


59 


11.47  (-1.11,5.11) 

1 1 .49  a.  hay  fuerte  interaccion 

b.  F  =  37.85  con  valor  p  =  .000;  sf  d.  no 
11.51  b.  sf  c.  Como  la  interaccion  es  significativa, 
la  atencion  debe  concentrarse  en  medias  para  las 
combinaciones  individuales  de  nivel  de  factor, 
d.  Capacitacion:  .05  <  valor  p  <  .10;  capacidad: 
valor p  <  .005;  interaccion:  .01  <  valor p  <  .025 
1 1 .53  a.  factorial  de  2  X  4;  estudiantes,  genero  en  los 
dos  niveles,  escuelas  a  cuatro  niveles  c.  no; 
F  =  1.19  e.  El  principal  efecto  para  escuelas 


11.69  a.  experimento  factorial  b.  sf;  F  =  7.61 
c .  w  =  2.67 

11.71  a.  diseno  completamente  aleatorizado 
b.  Sf,  hay  una  diferencia  significativa. 


F  P 

126.85  0.000 


1 1 .73  No  hay  evidencia  de  no  normalidad.  Parece  haber 
variacion  de  error  ligeramente  mas  grande  para 
los  valores  mas  pequenos  comparados  con  los 
valores  mas  grandes  de  y. 


F  = 

126.85,  valor  p  =  .000 

Source 

DF 

SS  MS 

Site 

2 

132.277  66.139 

Error 

21 

10.950  0.521 

Total 

23 

143 .227 

Capitulo  12 


es  significativo;  F  = 

27.75;  0)  = 

82.63  de  Tukey. 

12.1 

interseccion  con  eje  y 

=  1 ,  pendiente 

=  2 

11.55  a. 

12.3 

y  = 

=  3  —  x 

Source 

DF 

SS 

MS 

F 

P 

12.7 

a. 

y  =  6.00  -  .557x 

c. 

4.05 

Training 

1 

4489 . 00 

4489 . 00 

117.49 

0 . 000 

d. 

Analysis  of  Variance 

Situation 

1 

132.25 

132.25 

3.46 

0 . 087 

Source 

DF 

ss 

MS 

Interaction 

1 

56.25 

56.25 

1.47 

0.248 

Regression 

1 

5.4321 

5.4321 

Error 

12 

458 . 50 

38.21 

Residual  Error 

4 

0 . 1429 

0 . 0357 

Total 

15 

5136 . 00 

Total 

5 

5 . 5750 
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12.9  a.  Sxx  =  21066.82;  Syy  =  .374798; 

Sxy  =  88.80003  b.  y  =  .0187  + 

.00422*  d.  .44 

e.  Analysis  of  Variance 

Source  DF  SS  MS 

Regression  1  0.37431  0.37431 

Residual  Error  7  0.00049  0.00007 

Total  8  0.37480 

12.11  a.  y  =  API;  x  =  ELL  b.  si 

c.  y  =  731.277  -  3.040.V  d.  si 
12.13  a.  si  b.  y  =  -11.665  +  .755* 
c.  y  =  52.51 

12.15  a.  fuerte  relacion  lineal  positiva 

b.  aproximadamente  1 

c.  y  =  12.221  +  .815*  d.  y  =  62.75 

12.17  a.  si,  t  =  5.20  b.  F  =  27.00 

c.  1.025  =  3.182;  F05  =10.13 
12.19  a.  sf ,F  =  152.10  con  valor  p  =  .000 

b.  r2  =  .974 

12.21  a.  y  =  costo,  x  =  distancia 

b.  y=  128.58  +  .12715* 

d.  t  =  6.09;  r 2  =  .699 

12.23  a.  sf;  t  =  3.79  y  F  =  14.37  con  valor 
p  =  .005  b.  no  c.  r2  =  .642 
d.MSE  =  5.025  e.  (.186,  .764) 

12.25  a.  sf  b.  y  =  -26.82  +  1.2617* 

c.  sf;  t  =  7.49  y  F  =  56.05  con 
valor  p  =  .000  d.  (.7768,  1.7466) 

12.27  a.  sf;  rechazar  H0,  t  =  7.15 

b.  (.5362,  1.0944)  c.  sf;  el  valor  /3  =  1  esta 
contenido  en  el  intervalo. 

12.29  grafique  residuales  contra  ajuste;  dispersion 
aleatoria  de  puntos,  sin  figuras 

12.31  no 

12.33  a.  curvaligera  b.  95.9%  de  variacion  total 
explicada  por  el  modelo  de  lfnea  recta 

c.  fuerte  figura  curvilfnea  indica  que  la  relacion 
puede  ser  curvilfnea 

12.35  a.  relacion  positiva  mas  bien  fuerte 

b.  sf;  Toshiba  37HLX95  c.  sf;  no 
12.37  a.  (4.6006,5.1708)  b.  (4.2886, 

5.4829)  c.  x  =  8;  extrapolacion 
12.39  a.  curvaligera  b.  95.7%  de  variacion  total 
explicada  por  el  modelo  de  lfnea  recta 

c.  la  figura  indica  que  la  relacion  puede  ser 
curvilfnea. 

12.41  a.  (2.01,3.74)  b.  (-.77,3.02)  c.  *  =  0 

12.43  a.  (198.178,244.254) 

b.  (126.235,  316.197)  c.  no 


12.47  a.  positiva  b.  r  =  .9487;  r2  =  .9000 
12.49  b.  r  =  .982  c.  96.5% 

12.51  a.  positiva  b .  r  =  .760;  sf,  t  =  2.615 
12.53  sf;  t  =  3.158  con  valor p  <  .01 
12.55  a.  analisis  de  correlacion  b.  r  =  .98 1 
12.57  a.  posiblemente  b.  r  =  .658;  sf,  t  =  2.140 
12.59  a.  sf  b.  >  =  80.85  +  270.82* 

c.  sf;  t  =  3.96  con  valor  p  =  .003 

d.  (112.1,  157.9) 

12.61  a.  r=  .980  b.  r2  =  .961 

c.  y  =  21.9  +  15.0*  d.  La  varianza  no  es 
constante  para  toda  x. 

12.63 

Analisis  de  regresion:  API  contra  ELL 

The  regression  equation  is 


API  =  731  - 

3 . 04  ELL 

Predictor 

Coef 

StDev 

T 

P 

Constant 

731.28 

22 . 81 

32.06 

0 . 000 

ELL 

-3.0399 

0 . 7551 

-4.03 

0 . 007 

S  =  33.72 

R-Sq  =  73.0% 

R-Sq (adj )  = 

68 . 5% 

Analysis  of 

Variance 

Source 

DF  SS 

MS 

F 

P 

Regression 

1  18422 

18422 

16.21 

0 . 007 

Residual  Error  6  6820 

1137 

Total 

7  25242 

12.65  a.  no;  t  =  2.066  con  valor p  >  .05 

b.  r2  =  .299 

1 2.67  no;  la  varianza  no  es  constante  para  toda  x. 

12.69  a.  fuerte  relacion  positiva 

b.  r2  =  .778;  77.8%  c.  y  =  -14.150  + 
21.430*;  sf,  t  =  5.30  d.  sf 

12.71  en  los  extremos  de  la  region  experimental 
12.73  a.  y  =  20.47  -  .758* 

b. 

Source  DF  SS  MS  F  P 

Regression  1  287.28  287.28  493.40  0.000 

Residual  Error  8  4.66  0.58 

Total  9  291.94 

c.  Rechazar  H0,  t  =  —22.21  d.  (—.86,  —.66) 

e.  (9.296,  10.420)  f.  r2  =  .984 

12.77  a.  interseccion  con  el  eje  y  =  3; 
pendiente  =  —  0.5 

Capitulo  13 

13.1  b.  rectas  paralelas 
13.3  a.  sf,  F  =  57.44  con  valor  p  <  .005 
b.  R2  =  .94 

13.5  a.  cuadratico  b.  R2  =  .815;  relativamente 
buen  ajuste  c.  sf,  F  =  37.37  con  valor 

p  =  .000 
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13.7  a.  b0  =  10.5638  b.  sf,  t  =  15.20  con  valor 

p  =  .000 

13.9  b.  t  =  —8.11  con  valor  p  =  .000;  rechazar  H0\ 
f32  =  0  a  favor  de  Hp.  (32  <  0. 

13.11  a.  R2  =  .9955  b.  X2(adj)  =  99.3% 

c.  El  modelo  cuadratico  ajusta  ligeramente 
mejor. 

13.13  a.  Usar  variables  x2,  x2  y  x4.  b.  no 
13.15  a.  y  =  -8.177  +  292.^  +  4.434.v2 

b.  Rechazar  H0:  F  =  16.28  con  valor  p  =  .002. 
El  modelo  contribuye  con  information  significa- 
tiva  para  la  prediction  de  y.  c.  si,  t  =  5.54 
con  valor  p  =  .001  d.  R2  =  .823;  82.3% 

13.17  a.  cuantitativa  b.  cuantitativa 

c.  cualitativa;  x,  =  1  si  la  planta  B,  0  de 
otro  modo;  x2  =  1  si  la  planta  C,  0  de  otro 
modo  d.  cuantitativa  e.  cualitativa; 
x2  =  1  si  turno  de  dla,  0  si  turno  de  noche 

13.19  a.  x2  b.  y  =  12.6  +  3.9x22  o 
y  =  13.14  -  1.2x2  +  3.9x22 

13.21  a.  y  =  (30  +  j3ixl  +  (32x2  +  ftxiX2  +  e  con 
x2  =  1  si  pepino,  0  si  algodon  c.  No,  la 
prueba  para  interaccion  da  t  =  .63  con  valor 
p  =  .533  d.  si 

13.23  y  =  /30  +  /3iXi  +  f32x\  +  /3>r2  +  (ipc\X2 

+  /35X|X2  +  s 

13.25  a.  y  =  8.585  +  3.8208x  -  0.21663x2 

b.  R2  =  .944  c.  si;  F  =  33.44 

d.  si;  t  =  —4.93  con  valor  p  =  .008 

e.  no 

13.27  b.  y  =  4.10  +  1.04Xi  +  3.53x2  +  4.76x3  - 
0.43x3x2  —  0. 08x^3  c.  si;  t  =  —2.61  con 

valor  p  =  .028  d.  no;  F  =3.86; 
considere  eliminar  los  terminos  de  interaccion. 

13.29  a.  y  =  (30  +  /SiXi  +  (32x2  +  /33x2  +  /34XiX2 
+  /35x2x2  +  e  b .  F  =  25.85;  R2  =  .768 

c.  y  =  4.51  +  6.394X!  +  .1318x2, 

d.  y  =  -46.34  +  23.458x,  -  ,3707x2 

e.  no;  t  =  .78  con  valor  p  =  .439 

13.31  a.  no;  xu  x2,  x3  b.  y  =  f30  +  jSiXi  +  /32x2 

+  [3iX\  +  4X4  +  /3>r5  +  e 

c.  R2  =  91.4%  y  R2(adj)  =  88.7%;  si. 

d.  Xi,  x2,  y  posiblemente  x4;  y  =  (in  +  (3lx]  +  (32x2 
+  (3pc 4  +  e;  R2( adj )  =  89.8%;  el  modelo  reducido 
es  mejor  que  el  modelo  completo. 

13.35  a.  99.9% 

b.  si;  F  =  1676.61  con  valor  p  =  .000 

c.  si;  t  =  —2.65  con  valor  p  =  .045 

d.  si;  t  =  15.14  con  valor  p  =  .000 


e.  Lineal:  R2(adj)  =  91.9%,  cuadratico:  A1 2 (adj) 
=  99.8%,  termino  cuadratico  es  signibcativo. 

f.  El  termino  cuadratico  esta  faltante. 

Capi'tulo  14 

14.3  a.  X2  >  12.59  b.  X2  >  21.666 
c.  X2  >  29.8194  d.  X2  >  5.99 

14.5  a.  H0:  p,  =  p2=  p3  =  pA  =  p5  =  1/5 
b.  4  c.  9.4877  d.  X2  =  8.00 

e.  No  rechazar  H0. 

14.7  SI,  X2  =  24.48;  los  automovilistas  tienden  a 
preferir  los  carriles  interiores. 

14.9  no,  X2  =  3.63 
14.11  no,  X2  =  13.58 
14.13  si;  no  rechazar  F[0;  X2  =  1.247 
14.15  si;  rechazar  H0;  X2  =  28.386 

14.17  8 

14.19  Rechazar  Hp,  X2  =  18.352  con  valor  p  =  .000. 

14.21  a.  si;  X2  =  7.267 

b.  .025  <  valor  p  <  .05 

14.23  a.  si;  rechazar //0;  X2  =  20.937 
b.  no;  X2  =  1.255 

14.25  a.  no;  no  rechazar  H0\  X2  =  6.447 

b.  valor  p  >  .10;  si 

14.27  a.  X2  =  10.597  b.  X2  >  13.2767 

c.  No  rechazar  Fl0.  d.  .025  <  valor  p  <  .05 

14.29  si;  X2  =  24.31 

14.31  a.  Cada  tipo  de  atencion  representa  una  pobla- 
cion  binomial  en  la  que  medimos  la  presencia 
o  ausencia  de  servicios  EMI. 
b.  si;  X2  =  18.446 

14.33  SI,  rechazar  H0;  X2  =  36.499. 

14.35  no,  X2  =  4.4  con  valor  p  >  .10 
14.37  no,  X2  =  1.89  con  valor  p  >  .10 
14.39  a.  no,  X2  =  1.815  b.  valorp>.10 
14.43  no;  no  rechazar  H0\  X2  =  1.311. 

14.45  a.  Rechazar //0;  X2  =  18.527.  b.  Rechazar 
H0-  z  =  4.304;  si. 

14.49  si,  X2  =  7.488  con  .005  <  valor  p  <  .01 

14.51  si,  X2  =  6.190  con  .025  <  valor  p  <  .05; 

(.347,  .483) 

14.53  a.  no;X2  =  3.259  con  valor  p  =  .196 

b.  no;  X2  =  1.054  con  valor  p  =  .788 

c.  si 

14.55  no,  X2  =  3.953  con  valor  p  =  .139 
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14.57  a.  No  rechazar  H0\  X 2  =  3.660  con  valor 
p  =  .454;  si. 

14.59  a.  sf;X2  =  1 1.690  con  valor/?  =  .003 

b.  La  susceptibilidad  de  un  resfrfo  parece  dismi- 
nuir  cuando  aumenta  el  numero  de  parentescos. 

14.61  Si,  rechazar  H0\  X2  =  16.535. 

14.63  a.  27.69  b.  5.99 

14.65  Los  consumidores  tienen  una  preferencia; 

X2  =  18.5  con  valor  p  =  .0001. 

14.69  no;  X2  =  2.87  con  valor  p  =  .2378 

Capi'tulo  15 

15.1  a.  T\  b.  31  c.  27 

15.3  a.  H0:  las  distribuciones  poblacionales  son  iden- 
ticas;  //a:  la  poblacion  1  corrida  a  la  izquierda  de 
lapoblacion  2  b.  7)  =  16;  T*\  =  39 

c.  T  <  19  d.  si;  rechazar  H0 
15.5  No  rechazar  H0\  z  =  —1.59. 

15.7  No  rechazar  H0;  T  =  102. 

15.9  sf;  rechazar //0;  T  =  45 
15.11  sf;  rechazar  H0\  T  =  44 
15.13  b.  a  =  .002,  .007,  .022,  .054,  .115 

15.15  de  una  cola:  n  =  10:  a  =  .001,  .011,  055; 
n  =  15:  a  =  .004,  .018,  .059;  n  =  20: 
a  =  .001,  .006,  .021,  .058,  .132;  de  dos  colas: 
n  =  10:  a  =  .002,  .022,  .110;  n  =  15: 
a  =  .008,  .036,  .118;  n  =  20:  a  =  .002,  .012, 
.042,  .116 

15.17  a.  H0:  p  =  //a:  p  \ ;  region  de  rechazo: 

{0,  1,  7,  8};  x  =  6;  no  rechazar  H0en  a  =  .07; 
valor  p  =  .290. 

15.19  z  =  3.15;  rechazar  H0. 

15.21  b.  T  =  min{  T+,  T  }  c.  L<137 

d.  No  rechazar  H0. 

15.23  No  rechazar  H0\  z  =  —.34. 

15.25  a.  Rechazar  H0;  7=  1.5  b.  Los  resultados 
no  concuerdan. 

15.27  a.  no;  T=  6.5 

15.29  a.  No  rechazar  H0\  x  =  8.  b.  No  rechazar 
H0\  T  =  14.5. 

1 5.31  a.  prueba  de  diferencia  pareada,  prueba  del  sig- 
no,  prueba  de  rango  con  signo  de  Wilcoxon 
b.  Rechazar  H0  son  ambas  pruebas;  x  =  0  y 
T=  0. 


15.33  sf,  H  —  13.90 

15.35  a.  no;  H  =  2.63  b.  valor/?  >  .10 
c.  valor  p  >  .10 

1 5.37  no;  H  =  2.54  con  valor  /?  >  .  10 

15.39  a.  Rechazar  H0;  Fr  =  21.19. 

b.  valor  p  <  .005  d.  F  =  75.43 

e.  valor  p  <  .005  f.  Los  resultados  son 

identicos. 

15.41  a.  No  rechazar  H0\  Fr  =  5.81. 
b.  .05  <  valor  /?  <  .10 

15.43  a.  rs  >  .425  b.  rs  >  .601 

15.45  a.  |r,|  >  .400  b.  |rj  >  .526 

15.47  a.  -.593  b.  sf 

15.49  a.  r,  =  .811  b.  sf 

15.51  sf 

15.53  sf,  r,  =  .9118 

15.55  a.  No  rechazar  H0\  x  =  2. 

b.  No  rechazar  H0\  t  =  — 1.646. 

15.57  a.  No  rechazar  HQ\  x  =  7. 
b.  No  rechazar  H0;  x  =  7. 

1 5.59  No  rechazar  H0  con  la  prueba  de  la  suma  de  ran¬ 
go  de  Wilcoxon  ( T  =  77)  o  la  prueba  de  diferen¬ 
cia  pareada  ( t  =  .30). 

1 5.61  No  rechazar  H0  usando  la  prueba  del  signo 
(x  =  2);  no. 

15.63  sf;  rs  =  -.845 

15.65  Rechazar  H0;T=  14. 

15.67  a.  Rechazar  H0;  Fr  =  20.13.  b.  Los  resulta¬ 
dos  son  iguales. 

15.69  a.  Rechazar  7/0;  H=  9.08. 

b.  .025  <  valor  p  <  .05  c.  Los  resultados 
son  iguales. 

15.71  a.  no  b.  diferencias  significativas  entre  las 
respuestas  a  las  tres  tasas  de  aplicacion; 

Fr  =  10.33  con  valor  /?  =  .006 

15.73  T  =  19.  T05  =  21  {T01  =  18.)  Rechazar  H0. 

15.75  z  =  1.18  <  z. os  =  1.645;  la  iluminacion  no  es 
efectiva 

15.77  H  =  7.43  df=  3  valor  /?  =  0.059;  no  hay  diferen¬ 
cia  significativa 

15.79  a.  rs  =  .738.  b.  valor/?  =  .025  <  .05;  sf, 
correlacion  positiva 
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Analisis  de  correlation,  533-537 
Analisis  de  regresion 

mala  interpretation  de,  580-581 
por  pasos,  579-580 
prediction  de  valor  de,  522 
software  de  computadora  para,  517 
Analisis  de  regresion  multiple 

analisis  de  regresion  por  pasos  y,  579-580 
analisis  de  variancia  para,  555-556 
conjuntos  de  prueba  de  coeficientes  de 
regresion  y,  575-577 
estimation  y  prediction  y,  559 
explication  de,  552-554 
graficas  residuales  y,  578-579 
interpretation  de  resultados  de  regresion 
significativa  y,  557-558 
mala  interpretation  de,  580-581 
metodo  de  rmnimos  cuadrados  para,  554- 
555 

MINITAB,  569-571,  583-585 
modelo  de  regresion  polinomial  y,  559-562 
modelo  lineal  general  para,  552-553 
pasos  en,  582 

utilidad  de  modelo  de  regresion  y,  556-557 
variables  pronosticadoras  cuantitativas  y 
cualitativas,  566-571 
verification  de  suposiciones  de  regresion 
y,  558-559 

Analisis  de  regresion  por  pasos,  579-580 
Analisis  de  varianza  (ANOVA),  Vease 
tambien  Varianza 
calculos  para,  459 

clasificacion  de  medias  poblacionales, 
462-465 

en  cuadrados  medios,  452,  454,  457,  468, 
470,510 

experimento  factorial  a  X  b,  478-484 
explication  de,  449,  490-491 
graficas  residuales  y,  488-490 
MINITAB,  453-454,  458,  483,  489-490, 
492-495,  653 

para  diseno  aleatorizado  a  bloques,  467-473 
para  diseno  completamente  aleatorizado, 
450-458 

para  regresion  lineal,  509-51 1 
para  regresion  multiple,  555-556 
prueba  F,  481-482,  518,  556 
suposiciones  para,  449-450,  487-490 
Applets 

aproximacion  normal  a  probabilidades 
binomiales,  239-240 
comparacion  de  t  y  z,  390-391 
correlation,  106-107,  535 
curvas  normales,  224 


distribution  discreta  de  probabilidad, 
165-166 

eventos  sencillos,  138 

explication  de,  6,  34 

grafica  de  caja,  82-83 

grafica  de  dispersion,  104,  504 

intervalo  de  confianza,  312,  314 

media  y  mediana,  56 

metodo  de  mmimos  cuadrados,  506, 

508 

potencia  de  prueba  z,  358 
probabilidades  binomiales,  190-192, 
239-240 

probabilidades  de  distribution  normal, 
230-233 

probabilidades  de  Student,  389,  392,  412 
probabilidades  F,  456,  470 
probabilidades  ji  cuadrada,  419-420,  596 
probabilidades  normales  para  medias, 
270-271 

probabilidades  t,  537 
prueba  de  bondad  de  ajuste,  598 
prueba  de  independencia  ji  cuadrada,  605 
prueba  de  media  poblacional  para  muestra 
pequena,  396 

prueba  de  muestra  grande  de  media  pobla¬ 
cional,  353-354 
prueba  para  pendiente,  516 
prueba  t  de  dos  muestras,  404 
puntajes  z ,  232-233 
recta,  109 

Teorema  de  Liinite  Central,  265 
uso  de,  35-37 
variancia,  64 
Aproximacion 

de  Satterthwaite,  406 
Aproximacion  normal 

a  distribution  de  probabilidad  binomial, 
237-243 

para  prueba  de  rango  con  signo  de  Wil- 
coxon,  647-648 
para  prueba  de  signo,  640-641 
para  prueba  de  suma  de  rango  de  Wil- 
coxon,  634-637 

Aproximacion  Poisson,  a  distribution  bino¬ 
mial,  201-202,  237 
Area  acumulativa,  225,  229 
Articulos  defectuosos,  283-285 
Asignacion  aleatoria,  45 1 

Bloqueo.  Vease  tambien  Disenos  de  bloque 
aleatorizado 

explication  de,  414,  467 
precauciones  respecto  a,  473 


Bloques,  414 

Bondad  de  la  inferencia,  299 
Clase  modal,  57 

Clasificacion  de  una  via,  450.  Vease  tambien 
Disenos  completamente  aleatorizado 
Coeficiente  de  correlation 
applet,  106-107,  535 
calculo  de,  107-108,  111 
explication  de,  105-106,  518,  533 
muestra  de  momento  de  producto  Pearson, 
533-534 
poblacion,  536 

prueba  de  hipotesis  respecto  a,  536-537 
rango,  660-664 
uso  de,  111-112 

Coeficiente  de  correlation  de  rango,  660-664 
Coeficiente  de  correlation  de  rango  de  pobla¬ 
cion,  664 

Coeficiente  de  correlation  de  rango  de 
Spearman 

explication  de,  660-664 
valores  crfticos  de,  705 
Coeficiente  de  determination,  518-519, 
556-557 

Coeficiente  Pearson  de  correlation  muestral 
de  momento  de  producto,  533-534 
Coeficientes  de  correlation  poblacional,  536 
Coeficientes  de  regresion 

conjuntos  de  prueba  de,  575-577 
parciales,  575-577 
Coeficientes  de  regresion  parcial 
explication  de,  553,  554,  556 
prueba  de  significancia  de,  557 
Coeficientes,  correlation,  105-106 
Combinaciones,  regia  de  conteo  para,  140- 
142 

Comparaciones  apareadas 

ejecucion  de  programas  de  computadora, 
465 

metodo  de  Tukey  para,  463,  464,  484 
Complementos 

calculo  de  probabilidades  para,  146-147 
de  eventos,  144,  146,  147 
reglas  para,  147-148 
Coeficiente  de  confianza 
explication  de,  307-308 
uso  de,  308,  309 

Control  de  proceso  estadfstico  (SPC) 
explication  de,  28 1 

grafica  de  control  para  media  de  proceso  y, 
281-283 

grafica  de  control  para  proportion  de 
piezas  defectuosas  y,  283-285 
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Correction  de  continuidad,  240 
Correction  para  media  (CM),  451 
Correlation  lineal,  537 
Covarianza,  106 
Cuadratico  medio 

en  analisis  de  varianza,  452,  454,  457,  468, 
470,510 

explication  de,  452,  454,  468 
Cuartiles 

calculo  de  muestra,  78-80 
explication  de,  78 
inferiores,  77,  78 
superiores,  77,  78 
Cuartiles  inferiores,  77,  78 
Cuartiles  superiores,  77,  78 
Cuenta  de  celda 

estimation  de,  603-604 
explication  de,  595 
Cumulos,  258 
Curva  de  potencia,  357 
Curvas  normales 

areas  bajo,  226-228,  688-689 
calculo  de  probabilidades  bajo,  228,  229, 
231,232 

probabilidades  binomiales  y,  238 
Datos 

bivariados,  9,  98  (Vease  tambien  Datos 
bivariados) 

categoricos,  10-14  ( Vease  tambien  Datos 
categoricos) 

cuantitativos,  17-24,  105-107 
explication  de,  8 

formulas  para  media  y  variancia  para,  74 
metodos  para  describir,  53 
multivariados,  9 
univariados,  9 
Datos  bivariados 
explication  de,  9,  98 

graficas  de  dispersion  para  variables  cuan- 
titativas  y,  102-104 
graficas  para  variables  cualitativas  y, 
98-100 

medidas  numericas  para  cuantitativos, 
105-112 

MINITAB  para  describir,  115-118 
Datos  categoricos 

aplicaciones  de  prueba  ji  cuadrada  y, 
615-616 

clasificacion  bidireccional  con  totales  fijos 
de  renglon  o  columna  y,  610-612 
equivalencia  de  pruebas  estadfsticas  y, 
614-615 

estadfstica  ji  cuadrada  de  Pearson  para, 
596-597 

explication  de,  10,  595 
graficas  para,  11-14 

prueba  de  bondad  de  ajuste  para,  597-599 
tablas  de  contingencia  y,  602-607 
Datos  cuantitativos 
graficas  para,  17-24 

medidas  numericas  para  bivariados,  105-107 
Datos  multivariados,  9 
Datos  univariados,  9 
Densidad,  de  probabilidad,  22 1 
Desviacion 

estandar,  62-63,  65-70 
explication  de,  61-62 
Desviacion  estandar 
calculo  de,  65 


en  resultados  de  investigation,  304 
explication  de,  62-63 
para  distribution  de  probabilidad  de 
Poisson,  198 

para  variables  aleatorias  binomiales,  186-188 
para  variables  aleatorias  discretas,  166-170 
poblacional,  167,  223 
significancia  practica  de,  66-70 
Desviacion  estandar  de  poblacion,  167,  223 
Diagramas  de  arbol,  130-131 
Diagramas  de  Venn 
eventos  en,  146,  147 
explication  de,  1 30 

Diseno  de  muestreo.  Vease  Diseno  experi¬ 
mental 

Diseno  experimental 

bloque  aleatorizado,  466-473 
clasificacion  bidireccional,  478-484 
completamente  aleatorizado,  450-458 
elementos  de,  448-449 
explication  de,  4-5,  255-258,  448-449 
Disenos  completamente  aleatorizados 
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Distribuciones  de  probabilidad  continua, 
220-222 
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Distribuciones  muestrales 
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para  proportion  poblacional,  314-315 
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105-108 
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Brett  Favre,  74,  398 
^Bueno  para  las  matematcias?,  462 
^Cafe  o  azul?,  372 

Calificacion  de  candidatos  politicos,  665 
Calificaciones  del  GRE,  466 
Campeones  de  bateo,  32-33 
Capacidades  en  elevadores,  235 
Carrera  de  100  metros,  136,  143 
Carreras  de  competencia,  665 
Cascos  de  seguridad,  424 
Chips  de  computadora  defectuosos,  207 
Cocina  de  gourmet,  642,  649 
Colores  de  autos,  196 
Comida  en  el  restaurante  Gerard’s,  143 
Comida  rapida  y  gasolineras,  197 
Comparacion  de  mariscales  de  carnpo 
de  la  NFL,  85,  409 
Control  de  transito,  649 
Costos  de  hotel,  367-368 
Crfticos  de  arte,  665-666 
iCual  Have  es?,  171 
^Cuantas  palabras?,  236 
^Cuanto  tiempo  fibre?,  101 
Descompostura  de  maquinas,  649 
Detectores  de  humo,  157 
Distancia  entre  brazos  extendidos  y 
estatura,  513-514,  522 
Distancias  de  frenado,  235 
El  asesinato  de  JFK,  609 
El  mejor  amigo  del  hombre,  197, 

El  problema  del  cumpleanos,  156 
El  viejo  fiel,  73 

Emergencias  de  automovilistas,  72 
^Enganar  en  sus  impuestos?,  162 
Equipo  defectuoso,  171 
^,Esta  usted  a  dieta?,  322 
Estadfsticas  en  beisbol,  539 


Estados  Unidos,  jpregunta!,  260 
Estatura  en  personas,  235 
Estrategias  en  futbol,  162 
Estudio  apresurado,  144 
Golf,  158 
Harry  Potter,  196 
Hijos  del  presidente,  73-74 
Hockey,  538 

^Hombres  en  Marte?,  307 
Itineraries,  142-143 
Jason  y  Shaq,  157-158 
Jugador  de  poquer,  143 
La  generation  del  sandwich,  613 
La  PGA,  171 
La  WNBA,  143 

Lentes  de  contacto  a  colores,  372 
Lesiones  en  futbol,  157 
^Letterman  o  Leno?,  170-171 
Los  SUV  (monovolumen),  317 
M&M’S,  101,  326-327,  377 
Matematicas,  462 
Mejores  20  pelfculas,  33 
Nadadores  de  estilo  fibre,  409 
^Necesita  lentes?,  135 
No  vuelta  a  la  izquierda,  416 
Numeros  “900”,  307 
Orden  de  nacimiento  y  exito 
universitario,  327 
Peyton  Manning,  533 
Planes  de  vacaciones,  143 
Precision  de  instrumentos,  423 
Problemas  de  transito,  143 
Profesor  Asimov,  512,  521 
Promedio  de  calificaciones,  335 
Propenso  a  accidentes,  204 
Que  ropa  usar,  142 
^Que  tan  largo  es?,  513 
Raquetas  de  tenis,  665 
Reproductores  de  DVD,  58 
Ruido  y  estres,  323,  368 
Ruleta,  135,  171 

Seguridad  en  un  aeropuerto,  162,  204 
Sistemas  de  seguridad,  196 
^.Starbucks  o  Peet’s®?,  156 
Temporada  de  cacerfa,  335 
Tenis,  171,236 
Tiempo  en  un  trabajo,  59 
Tintura  roja,  416 
Tomates,  274 
Un  juego  de  cartas,  143 
Una  mina  de  fosfato,  235 
Vacaciones  de  verano,  306-307 
Vetos  de  presidentes,  85 
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Respuestas  a  los  ejercicios  de  Mi  entrenador  personal 


Capftulo  1 


Capftulo  2 


Capftulo  3 


Capftulo  4 


Capftulo  5 


A.  B. 


0 

0  a  <  15 

15  a  <  30 

0 

0  a  <  1.0 

1.0  a  <2.0 

500 

500  a  <  525 

525  a  <  550 

90 

12.86 

15 

5.9 

.98 

1.0 

200 

25 

25 

A. 


Conjunto  de  datos 

Ordenados 

n 

Posicion  de  Q, 

Posicion  de  Q3 

Cuartil  inferior  Q, 

Cuartil  superior  Q3 

2,  5,  7,  1,  1,2,8 

1,1,2,  2,  5,  7,8 

7 

2nd 

6th 

1 

7 

5,  0,  1,3,  1,5,  5,  2,  4,  4,  1 

0,1,  1,1,  2,  3,  4,  4,  5,  5,5 

11 

3rd 

9th 

1 

5 

B. 


Conjunto  de  datos 
ordenado 

Posicion  de  Q, 

Valores 

adyacentes 

Q, 

Posicion  de  Q3 

Valores 

adyacentes 

q3 

0,1,4,  4,  5,9 

1.75 

1  and  4 

1  +  .75(3)  =  3.25 

5.25 

5  and  9 

5  +  .25(4)  =  6 

0, 1,3,3,  4,  7,7,8 

2.25 

1  and  3 

1  +  .25(2)=  1.5 

6.75 

7  and  7 

7  +  .75(0)  =  7 

1,1,2,  5,  6,  6,  7,  9,9 

2.5 

1  and  2 

1  +  .5(1)  =  1.5 

7.5 

7  and  9 

7  +  .5(2)  =  8 

A. 


X 

V 

xy 

Calcular: 

Covarianza 

0 

1 

0 

n=  3 

v  <2*><2y) 

s  n  =  1 

n  -  1 

2 

5 

10 

s,=  2 

4 

2 

8 

sr  =  2.082 

Coeficiente  de  correlacion 

2*=  6 

M 

II 

CO 

M 

II 

CD 

r=  —  =.240 

°x 

B. 


De  la  parte  A 

De  la  parte  A 

Calcular: 

Pendiente 

intercepto  y 

2*=  6 

s,=  2 

x  =  2 

b=r(-M  =  .25 

a  =  y  -  bx  =  2.167 

CO 

II 

X 

W 

s,  =  2.082 

y  =  2.667 

\s„) 

r  =  .240 

Recta  de  regresion: 

K  =  2.167  +  .25* 

P(A) 

P(B) 

Condiciones  para  los  eventos  A  y  B 

P(A  n  B) 

P(A  U  B) 

P(A|B) 

.3 

.4 

Mutuamente  excluyentes 

0 

.7 

0 

.3 

.4 

Independientes 

.12 

.58 

.3 

.1 

.5 

Mutuamente  excluyentes  y  dependientes 

0 

.6 

0 

.2 

.5 

Independientes 

.10 

.6 

.2 

Seccion  5.2  A.  B. 


.010,  .087,  .317, 
.663,  .922,1.000 


0,1, 2,  3,  4 

P(x  <  4) 

n/a 

.922 

4,5 

P(x  >  4) 

1 

IA 

OJ 

.337 

5 

P(x  >  4) 

1  -  P(x<  4) 

.078 

0, 1,2,3 

P(x  <  4) 

P(x<  3) 

.663 

2,3,4 

VI 

VI 

CNJ 

P(x<  4)  -  P(x<  1) 

.835 

4 

II 

P(x  <  4)  —  P(x  £  3) 

.259 
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Capftulo  5  Seccion  5.3  A.  B. 


1.5VU  

.223,  .558,  .809, 

0!  "223 

.934,  .981,. 996, 

1-5V1-5 

.999, 1.000 

H  "335 

0, 1,  .558 

C. 


0, 1,2,3 

P(x<  3) 

n/a 

.934 

3,  4,  5, . . . 

P(x>  3) 

1 

IA 

r>o 

.191 

4,  5,  6, . . . 

P(x  >  3) 

1 

IA 

CO 

.066 

0,1,2 

P(x  <  3) 

P(x<  2) 

.809 

2,3,4 

P(  2<x<4) 

P[x  <  4)  -  P[x  <  1 ) 

.423 

3 

P(x=  3) 

P(x<3)-  P(x<2) 

.125 

Capftulo  6  Seccion  6.3 


1.5 

n/a 

.9332 

2 

1  -  P(z<  2) 

1  -  .9772  =  .0228 

2.33 

1  -  P(z<  2.33) 

1  -  .9901  =  .0099 

-1.96,  1.96 

P(z<  1.96)  -  P(z<  -1.96) 

.9750  -  .0250  =  .9500 

-1.24,  2.37 

P(z<  2.37)  —  P(z<  -1.24) 

.9911  -  .1075  =  .8836 

-1 

n/a 

.1587 

Capftulo  6  Seccion  6.4 
A. 


1.  12;  18 


2.  si 


3.  12;  2.683 


B. 


1.  20,21 . 30 

2.  20;  19.5 

3.  2.80 

4.  2.80;  .9974;  .0026 

Capftulo  7  Seccion  7.5 

A.  B.  C. 


normal;  75;  2 

P(x  >  80);  2.5;  80;  2.5;  .9938;  .0062 

P(70  <  x  <  72);  -2.5;  - 1 .5;  70;  72;  -2.5;  - 1 .5;  .0668;  .0062;  .0606 

Capftulo/  Seccion  7.6 

A.  B.  C. 


normal;  .4;  .08165 

P[p  >  .5);  1 .22;  .5;  1.22;  .8888;  .1112 

P(.5  <p<  .6);  1.22;  2.45;  .5;  .6;  1.22;  2.45;  .9929;  .8888;  .1041 

Capftulo  9  A. _ _ _  B. 


Valor  p 

iValor  p  <  at 

Conclusion 

.0808 

no 

IMo  rechazar  H0 

.0069 

si 

Rechazar  H0 

.4592 

no 

No  rechazar  W0 

~0 

si 

Rechazar  W0 

Valor  crftico 

Region  de  rechazo 

Conclusion 

1.645 

z  >  1.645 

No  rechazar  Ha 

2.33 

z>  2.33 

Rechazar  H0 

1.96 

z>  1.96  or  z<  —1.96 

No  rechazar  Ha 

2.58 

z>  2.58  orz<  —2.58 

Rechazar  H0 
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TABLA  3  Areas  bajo  la  curva  normal,  paginas  688-689 


z 

.00 

.01 

.02 

.03 

.04 

.05 

.06 

.07 

.08 

.09 

-3.4 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0003 

.0002 

-3.3 

.0005 

.0005 

.0005 

.0004 

.0004 

.0004 

.0004 

.0004 

.0004 

.0003 

-3.2 

.0007 

.0007 

.0006 

.0006 

.0006 

.0006 

.0006 

.0005 

.0005 

.0005 

-3.1 

.0010 

.0009 

.0009 

.0009 

.0008 

.0008 

.0008 

.0008 

.0007 

.0007 

-3.0 

.0013 

.0013 

.0013 

.0012 

.0012 

.0011 

.001 1 

.0011 

.0010 

.0010 

-2.9 

.0019 

.0018 

.0017 

.0017 

.0016 

.0016 

.0015 

.0015 

.0014 

.0014 

-2.8 

.0026 

.0025 

.0024 

.0023 

.0023 

.0022 

.0021 

.0021 

.0020 

.0019 

-2.7 

.0035 

.0034 

.0033 

.0032 

.0031 

.0030 

.0029 

.0028 

.0027 

.0026 

-2.6 

.0047 

.0045 

.0044 

.0043 

.0041 

.0040 

.0039 

.0038 

.0037 

.0036 

-2.5 

.0062 

.0060 

.0059 

.0057 

.0055 

.0054 

.0052 

.0051 

.0049 

.0048 

-2.4 

.0082 

.0080 

.0078 

.0075 

.0073 

.0071 

.0069 

.0068 

.0066 

.0064 

-2.3 

.0107 

.0104 

.0102 

.0099 

.0096 

.0094 

.0091 

.0089 

.0087 

.0084 

-2.2 

.0139 

.0136 

.0132 

.0129 

.0125 

.0122 

.0119 

.0116 

.0113 

.0110 

-2.1 

.0179 

.0174 

.0170 

.0166 

.0162 

.0158 

.0154 

.0150 

.0146 

.0143 

-2.0 

.0228 

.0222 

.0217 

.0212 

.0207 

.0202 

.0197 

.0192 

.0188 

.0183 

-1.9 

.0287 

.0281 

.0274 

.0268 

.0262 

.0256 

.0250 

.0244 

.0239 

.0233 

-1.8 

.0359 

.0351 

.0344 

.0336 

.0329 

.0322 

.0314 

.0307 

.0301 

.0294 

-1.7 

.0446 

.0436 

.0427 

.0418 

.0409 

.0401 

.0392 

.0384 

.0375 

.0367 

-1.6 

.0548 

.0537 

.0526 

.0516 

.0505 

.0495 

.0485 

.0475 

.0465 

.0455 

-1.5 

.0668 

.0655 

.0643 

.0630 

.0618 

.0606 

.0594 

.0582 

.0571 

.0559 

-1.4 

.0808 

.0793 

.0778 

.0764 

.0749 

.0735 

.0722 

.0708 

.0694 

.0681 

-1.3 

.0968 

.0951 

.0934 

.0918 

.0901 

.0885 

.0869 

.0853 

.0838 

.0823 

-1.2 

.1151 

.1131 

.1112 

.1093 

.1075 

.1056 

.1038 

.1020 

.1003 

.0985 

-1.1 

.1357 

.1335 

.1314 

.1292 

.1271 

.1251 

.1230 

.1210 

.1190 

.1170 

-1.0 

.1587 

.1562 

.1539 

.1515 

.1492 

.1469 

.1446 

.1423 

.1401 

.1379 

-0.9 

.1841 

.1814 

.1788 

.1762 

.1736 

.1711 

.1685 

.1660 

.1635 

.1611 

-0.8 

.2119 

.2090 

.2061 

.2033 

.2005 

.1977 

.1949 

.1922 

.1894 

.1867 

-0.7 

.2420 

.2389 

.2358 

.2327 

.2296 

.2266 

.2236 

.2206 

.2177 

.2148 

-0.6 

.2743 

.2709 

.2676 

.2643 

.2611 

.2578 

.2546 

.2514 

.2483 

.2451 

-0.5 

.3085 

.3050 

.3015 

.2981 

.2946 

.2912 

.2877 

.2843 

.2810 

.2776 

-0.4 

.3446 

.3409 

.3372 

.3336 

.3300 

.3264 

.3228 

.3192 

.3156 

.3121 

-0.3 

.3821 

.3783 

.3745 

.3707 

.3669 

.3632 

.3594 

.3557 

.3520 

.3483 

-0.2 

.4207 

.4168 

.4129 

.4090 

.4052 

.4013 

.3974 

.3936 

.3897 

.3859 

-0.1 

.4602 

.4562 

.4522 

.4483 

.4443 

.4404 

.4364 

.4325 

.4286 

.4247 

-0.0 

.5000 

.4960 

.4920 

.4880 

.4840 

.4801 

.4761 

.4721 

.4681 

.4641 
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TABLA  3  (continuacion) 


z 

.00 

.01 

.02 

.03 

.04 

.05 

.06 

.07 

.08 

.09 

0.0 

.5000 

.5040 

.5080 

.5120 

.5160 

.5199 

.5239 

.5279 

.5319 

.5359 

0.1 

.5398 

.5438 

.5478 

.5517 

.5557 

.5596 

.5636 

.5675 

.5714 

.5753 

0.2 

.5793 

.5832 

.5871 

.5910 

.5948 

.5987 

.6026 

.6064 

.6103 

.6141 

0.3 

.6179 

.6217 

.6255 

.6293 

.6331 

.6368 

.6406 

.6443 

.6480 

.6517 

0.4 

.6554 

.6591 

.6628 

.6664 

.6700 

.6736 

.6772 

.6808 

.6844 

.6879 

0.5 

.6915 

.6950 

.6985 

.7019 

.7054 

.7088 

.7123 

.7157 

.7190 

.7224 

0.6 

.7257 

.7291 

.7324 

.7357 

.7389 

.7422 

.7454 

.7486 

.7517 

.7549 

0.7 

.7580 

.7611 

.7642 

.7673 

.7704 

.7734 

.7764 

.7794 

.7823 

.7852 

0.8 

.7881 

.7910 

.7939 

.7967 

.7995 

.8023 

.8051 

.8078 

.8106 

.8133 

0.9 

.8159 

.8186 

.8212 

.8238 

.8264 

.8289 

.8315 

.8340 

.8365 

.8389 

1.0 

.8413 

.8438 

.8461 

.8485 

.8508 

.8531 

.8554 

.8577 

.8599 

.8621 

1.1 

.8643 

.8665 

.8686 

.8708 

.8729 

.8749 

.8770 

.8790 

.8810 

.8830 

1.2 

.8849 

.8869 

.8888 

.8907 

.8925 

.8944 

.8962 

.8980 

.8997 

.9015 

1.3 

.9032 

.9049 

.9066 

.9082 

.9099 

.9115 

.9131 

.9147 

.9162 

.9177 

1.4 

.9192 

.9207 

.9222 

.9236 

.9251 

.9265 

.9279 

.9292 

.9306 

.9319 

1.5 

.9332 

.9345 

.9357 

.9370 

.9382 

.9394 

.9406 

.9418 

.9429 

.9441 

1.6 

.9452 

.9463 

.9474 

.9484 

.9495 

.9505 

.9515 

.9525 

.9535 

.9545 

1.7 

.9554 

.9564 

.9573 

.9582 

.9591 

.9599 

.9608 

.9616 

.9625 

.9633 

1.8 

.9641 

.9649 

.9656 

.9664 

.9671 

.9678 

.9686 

.9693 

.9699 

.9706 

1.9 

.9713 

.9719 

.9726 

.9732 

.9738 

.9744 

.9750 

.9756 

.9761 

.9767 

2.0 

.9772 

.9778 

.9783 

.9788 

.9793 

.9798 

.9803 

.9808 

.9812 

.9817 

2.1 

.9821 

.9826 

.9830 

.9834 

.9838 

.9842 

.9846 

.9850 

.9854 

.9857 

2.2 

.9861 

.9864 

.9868 

.9871 

.9875 

.9878 

.9881 

.9884 

.9887 

.9890 

2.3 

.9893 

.9896 

.9898 

.9901 

.9904 

.9906 

.9909 

.9911 

.9913 

.9916 

2.4 

.9918 

.9920 

.9922 

.9925 

.9927 

.9929 

.9931 

.9932 

.9934 

.9936 

2.5 

.9938 

.9940 

.9941 

.9943 

.9945 

.9946 

.9948 

.9949 

.9951 

.9952 

2.6 

.9953 

.9955 

.9956 

.9957 

.9959 

.9960 

.9961 

.9962 

.9963 

.9964 

2.7 

.9965 

.9966 

.9967 

.9968 

.9969 

.9970 

.9971 

.9972 

.9973 

.9974 

2.8 

.9974 

.9975 

.9976 

.9977 

.9977 

.9978 

.9979 

.9979 

.9980 

.9981 

2.9 

.9981 

.9982 

.9982 

.9983 

.9984 

.9984 

.9985 

.9985 

.9986 

.9986 

3.0 

.9987 

.9987 

.9987 

.9988 

.9988 

.9989 

.9989 

.9989 

.9990 

.9990 

3.1 

.9990 

.9991 

.9991 

.9991 

.9992 

.9992 

.9992 

.9992 

.9993 

.9993 

3.2 

.9993 

.9993 

.9994 

.9994 

.9994 

.9994 

.9994 

.9995 

.9995 

.9995 

3.3 

.9995 

.9995 

.9995 

.9996 

.9996 

.9996 

.9996 

.9996 

.9996 

.9997 

3.4 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9997 

.9998 
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TABLA  4 

Valores  crfticos 
de  t  pagina  691 


df 

t.ioo 

1 050 

to25 

f.070 

i.005 

df 

1 

3.078 

6.314 

12.706 

31.821 

63.657 

1 

2 

1.886 

2.920 

4.303 

6.965 

9.925 

2 

3 

1.638 

2.353 

3.182 

4.541 

5.841 

3 

4 

1.533 

2.132 

2.776 

3.747 

4.604 

4 

5 

1.476 

2.015 

2.571 

3.365 

4.032 

5 

6 

1.440 

1.943 

2.447 

3.143 

3.707 

6 

7 

1.415 

1.895 

2.365 

2.998 

3.499 

7 

8 

1.397 

1.860 

2.306 

2.896 

3.355 

8 

9 

1.383 

1.833 

2.262 

2.821 

3.250 

9 

10 

1.372 

1.812 

2.228 

2.764 

3.169 

10 

11 

1.363 

1.796 

2.201 

2.718 

3.106 

11 

12 

1.356 

1.782 

2.179 

2.681 

3.055 

12 

13 

1.350 

1.771 

2.160 

2.650 

3.012 

13 

14 

1.345 

1.761 

2.145 

2.624 

2.977 

14 

15 

1.341 

1.753 

2.131 

2.602 

2.947 

15 

16 

1.337 

1.746 

2.120 

2.583 

2.921 

16 

17 

1.333 

1.740 

2.110 

2.567 

2.898 

17 

18 

1.330 

1.734 

2.101 

2.552 

2.878 

18 

19 

1.328 

1.729 

2.093 

2.539 

2.861 

19 

20 

1.325 

1.725 

2.086 

2.528 

2.845 

20 

21 

1.323 

1.721 

2.080 

2.518 

2.831 

21 

22 

1.321 

1.717 

2.074 

2.508 

2.819 

22 

23 

1.319 

1.714 

2.069 

2.500 

2.807 

23 

24 

1.318 

1.711 

2.064 

2.492 

2.797 

24 

25 

1.316 

1.708 

2.060 

2.485 

2.787 

25 

26 

1.315 

1.706 

2.056 

2.479 

2.779 

26 

27 

1.314 

1.703 

2.052 

2.473 

2.771 

27 

28 

1.313 

1.701 

2.048 

2.467 

2.763 

28 

29 

1.311 

1.699 

2.045 

2.462 

2.756 

29 

00 

1.282 

1.645 

1.960 

2.326 

2.576 

00 

Fuente:  De  "Table  of  Percentage  Points  of  the  r-Distribution",  Biometrika  32  (1 941  ):300.  Reproducido  con 
permiso  de  the  Biometrika  Trustees. 
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